รายละเอียดซอฟแวร์:
รุ่น: 2.6.0
วันที่อัพโหลด: 20 Feb 15
การอนุญาต: Shareware
ราคา: 1900.00 $
ความนิยม: 63
โครงการ PDFTextStream เป็นข้อความรูปแบบไฟล์ PDF และห้องสมุดสกัดเมตาดาต้าที่พร้อมใช้งานสำหรับ Java, Python และ .NET
มันสนับสนุนทุกรุ่นสเปเอกสาร PDF (รวม v1.6 โดยใช้โปรแกรม Acrobat 7) การสกัดของข้อความที่เข้ารหัสโดยใช้ชุดอักขระไบต์คู่ (รวมทั้งจีน, ญี่ปุ่นและเกาหลี), ถอดรหัส 40 บิตและ 128 บิตเอกสารการเข้ารหัสและการสกัดของเมตาดาต้าเอกสารทั้งหมดให้โดยเอกสาร PDF (รวมถึงข้อมูลในแบบฟอร์มที่คั่นหน้าเว็บและคำอธิบายประกอบ)
รวมง่ายกับจาการ์ตา Lucene จะรวม
มีอะไรใหม่ ในข่าวประชาสัมพันธ์ฉบับนี้.
- รุ่นนี้รวมถึงความหลากหลายของการแก้ไขที่ทำ เพื่อให้แน่ใจว่า PDFTextStream มีความสามารถในการสกัดข้อความจากเอกสาร PDF ที่มีการไม่ลงรอยกันข้อกำหนด PDF.
- นอกจากนี้ยังมีความหลากหลายของการปรับปรุงประสิทธิภาพการทำงาน.
มีอะไรใหม่ ในรุ่น 2.3.0:
- เพิ่ม .isStruckThrough () วิธีการ com snowtide.pdf.TextUnit แสดงให้เห็นว่าตัวละครที่มีขีดลากผ่านมัน.
- การปรับปรุงสนับสนุน PDFTextStream แมปสำหรับตัวละครที่ฝัง.
- การคำนวณของช่องว่างระหว่างคำได้รับการแก้ไขอย่างถูกต้องบัญชีสำหรับช่องว่างที่มีการเข้ารหัสอย่างชัดเจนในเอกสารต้นฉบับ PDF.
- การจัดการที่ดีของ PDFTextStream ของการเข้ารหัสเนื้อหาคอมโพสิตซึ่งก่อนหน้านี้อาจล้มเหลวที่เกิดขึ้นในช่วงที่บางส่วนของเนื้อหารูปแบบไฟล์ PDF ถูก 'ละเลย' ในระหว่างการสกัด.
- แก้ไขข้อผิดพลาดใน VisualOutputTarget ที่ข้อความจากบรรทัดเดียวจะได้รับการแบ่งมากกว่าหลายบรรทัด
- แนวตั้งของข้อความที่ดีขึ้นสกัดโดยใช้ VisualOutputTarget
- ปรับปรุงให้ดีขึ้นสารสกัดจาก VisualOutputTarget ผลิตเพื่อขจัดช่องว่างเพิ่มเติมปลอมระหว่างคำอย่างใกล้ชิดติดกัน
มีอะไรใหม่ ในรุ่น 2.2.5:
- ข่าวประชาสัมพันธ์ฉบับนี้เพิ่มการสนับสนุนสำหรับการแยกข้อมูลรูปแบบ XFA เป็น XML.
- มันอย่างมีนัยสำคัญช่วยเพิ่มประสิทธิภาพในการสกัดข้อความโดยใช้ VisualOutputTarget การสนับสนุนสำหรับเอกสาร PDF ขนาดใหญ่กว่า 2GB.
- การแก้ไขข้อผิดพลาดที่เข้ารหัสจากแบบอักษร Type1 ฝังตัวก่อนหน้านี้ไม่ได้ถูกนำไปใช้อย่างถูกต้องในบางสถานการณ์.
- การแก้ไขสำหรับปัญหาที่มีเนื้อหาใหม่ในการปรับปรุงเอกสาร PDF บางครั้งถูกละเลย.
- การแก้ไขสำหรับปัญหาที่บุ๊คมาร์ค PDFDocEncoding เข้ารหัสและข้อมูลไม่ถูกถอดรหัสถูกต้อง.
- .getDestinationName () วิธีการใน com.snowtide.pdf.Bookmark.
ต้องการ
- Apache Lucene
ความคิดเห็นที่ไม่พบ