PDFTextStream

ภาพหน้าจอของซอฟแวร์:
PDFTextStream
รายละเอียดซอฟแวร์:
รุ่น: 2.6.0
วันที่อัพโหลด: 20 Feb 15
ผู้พัฒนา: Snowtide Informatics Systems, Inc.
การอนุญาต: Shareware
ราคา: 1900.00 $
ความนิยม: 2

Rating: nan/5 (Total Votes: 0)

โครงการ PDFTextStream เป็นข้อความรูปแบบไฟล์ PDF และห้องสมุดสกัดเมตาดาต้าที่พร้อมใช้งานสำหรับ Java, Python และ .NET
มันสนับสนุนทุกรุ่นสเปเอกสาร PDF (รวม v1.6 โดยใช้โปรแกรม Acrobat 7) การสกัดของข้อความที่เข้ารหัสโดยใช้ชุดอักขระไบต์คู่ (รวมทั้งจีน, ญี่ปุ่นและเกาหลี), ถอดรหัส 40 บิตและ 128 บิตเอกสารการเข้ารหัสและการสกัดของเมตาดาต้าเอกสารทั้งหมดให้โดยเอกสาร PDF (รวมถึงข้อมูลในแบบฟอร์มที่คั่นหน้าเว็บและคำอธิบายประกอบ)
รวมง่ายกับจาการ์ตา Lucene จะรวม

มีอะไรใหม่ ในข่าวประชาสัมพันธ์ฉบับนี้.

  • รุ่นนี้รวมถึงความหลากหลายของการแก้ไขที่ทำ เพื่อให้แน่ใจว่า PDFTextStream มีความสามารถในการสกัดข้อความจากเอกสาร PDF ที่มีการไม่ลงรอยกันข้อกำหนด PDF.
  • นอกจากนี้ยังมีความหลากหลายของการปรับปรุงประสิทธิภาพการทำงาน.

มีอะไรใหม่ ในรุ่น 2.3.0:

  • เพิ่ม .isStruckThrough () วิธีการ com snowtide.pdf.TextUnit แสดงให้เห็นว่าตัวละครที่มีขีดลากผ่านมัน.
  • การปรับปรุงสนับสนุน PDFTextStream แมปสำหรับตัวละครที่ฝัง.
  • การคำนวณของช่องว่างระหว่างคำได้รับการแก้ไขอย่างถูกต้องบัญชีสำหรับช่องว่างที่มีการเข้ารหัสอย่างชัดเจนในเอกสารต้นฉบับ PDF.
  • การจัดการที่ดีของ PDFTextStream ของการเข้ารหัสเนื้อหาคอมโพสิตซึ่งก่อนหน้านี้อาจล้มเหลวที่เกิดขึ้นในช่วงที่บางส่วนของเนื้อหารูปแบบไฟล์ PDF ถูก 'ละเลย' ในระหว่างการสกัด.
  • แก้ไขข้อผิดพลาดใน VisualOutputTarget ที่ข้อความจากบรรทัดเดียวจะได้รับการแบ่งมากกว่าหลายบรรทัด
  • แนวตั้งของข้อความที่ดีขึ้นสกัดโดยใช้ VisualOutputTarget
  • ปรับปรุงให้ดีขึ้นสารสกัดจาก VisualOutputTarget ผลิตเพื่อขจัดช่องว่างเพิ่มเติมปลอมระหว่างคำอย่างใกล้ชิดติดกัน

มีอะไรใหม่ ในรุ่น 2.2.5:

  • ข่าวประชาสัมพันธ์ฉบับนี้เพิ่มการสนับสนุนสำหรับการแยกข้อมูลรูปแบบ XFA เป็น XML.
  • มันอย่างมีนัยสำคัญช่วยเพิ่มประสิทธิภาพในการสกัดข้อความโดยใช้ VisualOutputTarget การสนับสนุนสำหรับเอกสาร PDF ขนาดใหญ่กว่า 2GB.
  • การแก้ไขข้อผิดพลาดที่เข้ารหัสจากแบบอักษร Type1 ฝังตัวก่อนหน้านี้ไม่ได้ถูกนำไปใช้อย่างถูกต้องในบางสถานการณ์.
  • การแก้ไขสำหรับปัญหาที่มีเนื้อหาใหม่ในการปรับปรุงเอกสาร PDF บางครั้งถูกละเลย.
  • การแก้ไขสำหรับปัญหาที่บุ๊คมาร์ค PDFDocEncoding เข้ารหัสและข้อมูลไม่ถูกถอดรหัสถูกต้อง.
  • .getDestinationName () วิธีการใน com.snowtide.pdf.Bookmark.

ต้องการ

  • Apache Lucene

ความคิดเห็นที่ PDFTextStream

ความคิดเห็นที่ไม่พบ
เพิ่มความคิดเห็น
เปิดภาพ!