รายละเอียดซอฟแวร์:
สามารถนำมาใช้ในการเขียนโปรแกรมรวบรวมข้อมูลการค้นหา (เดอร์) ที่หน้าเว็บเหมืองข้อมูลต่างๆ
PHPCrawl ดึงข้อมูลมันถูกกำหนดค่าให้เรียกและส่งผ่านไปยังปพลิเคชันที่มีประสิทธิภาพมากขึ้นสำหรับการประมวลผลต่อไป
คุณสมบัติ .
- กรอง URL และข้อมูลเนื้อหาชนิด
- กำหนดวิธีการที่จะจัดการกับคุกกี้
- กำหนดวิธีการที่จะจัดการกับไฟล์ robots.txt
- จำกัด กิจกรรมในรูปแบบต่างๆ
- โหมดมัลติประมวลผล
มีอะไรใหม่ ในข่าวประชาสัมพันธ์นี้:
- โรคจิตถาวร:
- ลิงค์ที่มี urlencoded บางส่วนและบางส่วนไม่ได้รับการสร้าง / เข้ารหัสได้อย่างถูกต้องในขณะนี้.
- การแกะแก้ปัญหาที่ไม่จำเป็น var_dump () จาก PHPCrawlerRobotsTxtParser.class.php
- เซิร์ฟเวอร์ชื่อที่บ่งบอกใน TLS / SSL ทำงานอย่างถูกต้องในขณะนี้.
- & quot; ฐาน href & quot;. -tags ในเว็บไซต์ได้รับการตีความอย่างถูกต้องในขณะนี้อีกครั้ง
มีอะไรใหม่ ในรุ่น 0.80 เบต้า:
- รหัสถูก refactored สมบูรณ์รังเพลิง PHP5-OO- รหัสและมากรหัสถูกเขียนใหม่.
- เพิ่มความสามารถในการใช้การใช้กระบวนการหลายแมงมุมเว็บไซต์ วิธีที่ & quot; goMultiProcessed () & quot; เพิ่ม.
- วิธี overridable ใหม่ & quot; initChildProcess () & quot; เพิ่มสำหรับการเริ่มต้นกระบวนการที่เด็กเมื่อมีการใช้ซอฟต์แวร์รวบรวมข้อมูลในหลายกระบวนการโหมด.
- Implementet ทางเลือก SQLite ภายในแคชกลไกสำหรับ URL ทำให้มันเป็นไปได้ที่จะแมงมุมเว็บไซต์ขนาดใหญ่มาก.
- วิธีที่ & quot; setUrlCacheType () & quot; เพิ่ม.
- วิธีการใหม่ setWorkingDirectory () เพิ่มสำหรับการกำหนดสถานที่ตั้งของโปรแกรมรวบรวมข้อมูลทำงานไดเรกทอรีชั่วคราวด้วยตนเอง ดังนั้นวิธีการที่ & quot; setTmpFile () & quot; ถูกทำเครื่องหมายเป็นเลิก (มีฟังก์ชั่ไม่มีอีกต่อไป).
- วิธีการใหม่ & quot; addContentTypeReceiveRule () & quot; แทนวิธีการเดิม & quot; addReceiveContentType () & quot;.
- ฟังก์ชั่น & quot; addReceiveContentType () & quot; ยังคงมีอยู่ แต่ถูกทำเครื่องหมายเป็นเลิก.
ต้องการ
- PHP 5 หรือสูงกว่า
- PHP กับการสนับสนุน OpenSSL
ความคิดเห็นที่ไม่พบ