รายละเอียดซอฟแวร์:
speedparser เป็น reimplementation กล่องดำของตัวแยกวิเคราะห์ฟีนิเวอร์แซล จะใช้สำหรับการแยก LXML อาหารสัตว์และอุปกรณ์เสริมสำหรับการทำความสะอาด HTML & nbsp;. เข้ากันได้ speedparser กับ feedparser เป็นสิ่งที่ดีมากสำหรับการย่อยที่เข้มงวดของฟิลด์ แต่ที่น่าสงสารสำหรับเขตข้อมูลนอกย่อยที่ ดูการทดสอบ / speedparsertests.py สำหรับข้อมูลเพิ่มเติมเกี่ยวกับสาขาที่มีมากหรือน้อยเข้ากันได้และที่ไม่ได้
เกี่ยวกับ Intel Core i5 750 วิ่งเพียงหนึ่งหลัก feedparser การจัดการ 2.5 ฟีด / วินาทีในการทดสอบชุดฟีด (ประมาณ 4200 "ฟีด" ในการทดสอบ / feeds.tar.bz2) ในขณะที่ speedparser จัดการประมาณ 65 ฟีด / วินาทีกับ HTML . ทำความสะอาดในวันและ 200 ฟีด / วินาทีที่มีการทำความสะอาดออก
ต้องการ
- หลาม
- LXML
ความคิดเห็นที่ไม่พบ