PDFMiner ทำงานเป็นครั้งแรกโดยการเนื้อหาของไฟล์ PDF และแปลงเป็นรูปแบบที่อ่อนมากขึ้นเช่น HTML
จากนั้นข้อความและข้อมูลที่เป็นสารสกัดและวิเคราะห์และขึ้นอยู่กับกฎระเบียบที่กำหนดไว้ล่วงหน้าแยกออกจากกันและนำเสนอให้กับผู้ใช้หรือส่งไปยังข้อมูลอื่น ๆ ที่มีประสิทธิภาพมากขึ้นเครื่องมือในการวิเคราะห์
หากวิเคราะห์ข้อความไม่ใช่สิ่งที่คุณตั้งใจจะทำคุณสามารถกำหนดค่า PDFMiner เพียงแค่ดึงหรือเพียงแค่แปลงข้อมูลในรูปแบบ PDF ได้เป็นอย่างดี
ฟังก์ชั่นที่สามารถทำงานแยกจากคนอื่นและอนุญาตให้ใช้คลื่นความถี่ที่กว้างขึ้นขอบคุณไป
คุณสมบัติ .
- งูใหญ่ 100% รหัสไม่มี C หรือ C ++
- แยกไฟล์ PDF
- วิเคราะห์ไฟล์ PDF
- แปลงไฟล์ PDF ให้เป็นรูปแบบอื่น ๆ
- ระบาย ToC
- ได้รับการติดแท็กเพียงเนื้อหา
- การสนับสนุนสำหรับจำนวนมากคุณสมบัติ PDF ข้อความ
- การสนับสนุนสำหรับจำนวนมากของรูปแบบอักษรภายในไฟล์ PDF
- การเข้ารหัสขั้นพื้นฐาน (RC4 สนับสนุน)
มีอะไรใหม่ ในข่าวประชาสัมพันธ์นี้:
- PDFDocument.initialize () วิธีการออกและไม่จำเป็น . รหัสผ่านจะได้รับเป็นข้อโต้แย้งของตัวสร้าง PDFDocument.
มีอะไรใหม่ ในรุ่น 20110515:.
- การเปลี่ยนแปลง API
- ระดับ LTPolygon ถูกเปลี่ยนชื่อเป็น LTCurve.
มีอะไรใหม่ ในรุ่น 20110227:.
- แก้ไขข้อผิดพลาดและการปรับปรุงการวิเคราะห์รูปแบบ
มีอะไรใหม่ ในรุ่น 20101226:.
- คู่ของ bugfixes และการปรับปรุงเล็กน้อย
มีอะไรใหม่ ในรุ่น 20101017:.
- คู่ของ bugfixes และการปรับปรุงเล็กน้อย
มีอะไรใหม่ ในรุ่น 20100424:.
- Bugfixes และการปรับปรุงเล็ก ๆ ในการสกัด TOC
ต้องการ
- งูหลาม 2.4 ถึง 3
ข้อ จำกัด .
- PDFMiner สามารถ 20 ครั้งช้ากว่า C / C ++ - ซอฟต์แวร์ตาม
ความคิดเห็นที่ไม่พบ