การใช้งานจำนวนมากที่จัดการกับข้อมูลที่ไม่มีโครงสร้างจำเป็นต้องเข้าถึงเนื้อหาข้อความของเอกสารรูปแบบหรือทำเครื่องหมายขึ้น องค์กรที่มีการเก็บเอกสารที่มักจะต้องมีการเข้าถึงเนื้อหาต้นฉบับเดิมที่จะทำให้เอกสารค้นหาและเปิดใช้งานการรวมเนื้อหาการรายงานและการทำเหมืองแร่ของคลังเอกสาร ค้นหาและการประยุกต์ใช้การดึงยังต้องแยกและข้อความ tokenize จากรูปแบบไฟล์ต่างๆ.
หนึ่งกลไกมาตรฐานในการเข้าถึงและดึงข้อความจากเอกสารที่มีให้โดยอินเตอร์เฟซ plug-in ที่ IFilter ใช้ในเครื่องมือค้นหาไมโครซอฟท์ มีการใช้งานไม่กี่ IFilter พัฒนาโดยไมโครซอฟท์และผู้ผลิตอื่น ๆ ที่ครอบคลุมความหลากหลายของรูปแบบไฟล์ที่มี มาตรฐานหรือความน่าเชื่อถือและคุณภาพการสกัดข้อความแตกต่างกันไปทั่วทั้งนักพัฒนาหลาย IFilter.
กรองข้อความ Opait เป็นโปรแกรมยูทิลิตี้ขนาดเล็กที่มีอินเตอร์เฟซที่ง่ายในการ IFilters ที่ติดตั้งอยู่บนคอมพิวเตอร์โฮสต์เช่นเดียวกับฟิลเตอร์สกัดข้อความที่กำหนดเองไม่กี่รายที่ทำงานโดยตรงกับรูปแบบไฟล์และปรับปรุงเมื่อเริ่มต้นการใช้งาน IFilter
. อินเตอร์เฟซที่จะดึงข้อความที่ให้บริการโดยห้องสมุดชั้นเล็ก ๆ เรียกว่า Opait.Filters ซึ่งรวมและสามารถนำมาใช้ในการรวมตัวกรองข้อความลงในโปรแกรม NET
ต้องการ
4.5 Framework .NET
ความคิดเห็นที่ไม่พบ