โครงการ PDFTextStream เป็นข้อความรูปแบบไฟล์ PDF และห้องสมุดสกัดเมตาดาต้าที่พร้อมใช้งานสำหรับ Java, Python และ .NETมันสนับสนุนทุกรุ่นสเปเอกสาร PDF (รวม v1.6 โดยใช้โปรแกรม Acrobat 7) การสกัดของข้อความที่เข้ารหัสโดยใช้ชุดอักขระไบต์คู่ (รวมทั้งจีน,...