Apache หมูได้เกิดจาก Apache Hadoop โครงการและเป็นหนึ่งในโมดูลที่อยู่ในความดูแลของการหาวิธีในการวิเคราะห์ข้อมูลที่ประมวลผลและการจัดเก็บ
หมูใช้ภาษาแบบสอบถามแบบกำหนดเองที่เรียกว่า "หมูละติน" ซึ่งเป็นเรื่องง่ายอย่างเหลือเชื่อที่จะเรียนรู้และให้การสนับสนุนทั้งสองรูปแบบเชิงสัมพันธ์และการทำงาน
ซึ่งหมายความว่าคุณสามารถใช้มันเป็นภาษา SQL คลาสสิกที่ได้รับประโยชน์จากข้อมูลร่วมและตัวกรองหรือคุณสามารถใช้คุณสมบัติ MapReduce มันทำแผนที่ข้อมูลและ reducers
โดยค่าเริ่มต้น Apache หมูได้หมายความว่าจะต้องใช้ในการติดตั้ง Hadoop แต่รุ่นใหม่อนุญาตให้ทำงานแยกผ่าน JVM แยกต่างหาก
มีอะไรใหม่ ในข่าวประชาสัมพันธ์ฉบับนี้.
- เครื่องมือการดำเนินการแบบเสียบ (เพื่อช่วยให้การทำงานของหมูในเครื่องมือที่ไม่ MapReduce ในอนาคต)
- โหมดออโต้ท้องถิ่น (งานที่มีขนาดการป้อนข้อมูลขนาดเล็กที่จะทำงานในกระบวนการ)
- การเพิ่มประสิทธิภาพ Fetch (เพื่อปรับปรุง interactiveness ของแสม)
- เคาน์เตอร์คงที่สำหรับโหมดท้องถิ่น
- การสนับสนุนสำหรับแคชขวดระดับผู้ใช้
- การสนับสนุนสำหรับการขึ้นบัญชีดำและยกเว้นคำสั่งหมู
- แก้ไขประสิทธิภาพและคุณสมบัติหลาย debuggability
- ไม่กี่หลังที่ไม่ได้ปรับเปลี่ยนอินเตอร์เฟซที่ใช้งานร่วมกันได้รับการแนะนำในรุ่นนี้จะทำให้การทำงานกับเครื่องมือหมูที่ไม่ MapReduce
มีอะไรใหม่ ในรุ่น 0.14.0:
- เครื่องมือการดำเนินการแบบเสียบ (เพื่อช่วยให้การทำงานในหมูไม่ เครื่องมือ -mapreduce ในอนาคต)
- โหมดออโต้ท้องถิ่น (งานที่มีขนาดการป้อนข้อมูลขนาดเล็กที่จะทำงานในกระบวนการ)
- การเพิ่มประสิทธิภาพ Fetch (เพื่อปรับปรุง interactiveness ของแสม)
- เคาน์เตอร์คงที่สำหรับโหมดท้องถิ่น
- การสนับสนุนสำหรับแคชขวดระดับผู้ใช้
- การสนับสนุนสำหรับการขึ้นบัญชีดำและยกเว้นคำสั่งหมู
- แก้ไขประสิทธิภาพและคุณสมบัติหลาย debuggability
- ไม่กี่หลังที่ไม่ได้ปรับเปลี่ยนอินเตอร์เฟซที่ใช้งานร่วมกันได้รับการแนะนำในรุ่นนี้จะทำให้การทำงานกับเครื่องมือหมูที่ไม่ MapReduce
มีอะไรใหม่ ในรุ่น 0.11.0:
- ข่าวประชาสัมพันธ์ฉบับนี้รวมถึง DateType ประเภทข้อมูล, อันดับ, CUBE และ ผู้ประกอบการยกเลิก, UDF ของ Groovy ประมาณลดที่กำหนดเอง tuples สคี-based และบูรณาการ HCatalog DDL.
มีอะไรใหม่ ในรุ่น 0.9.1:.
- ข่าวประชาสัมพันธ์ฉบับนี้ทำงานร่วมกับ Hadoop 0.20
มีอะไรใหม่ ในรุ่น 0.6:
- ม้าลายเพิ่มเป็นโครงการ contrib ดู http://wiki.apache.org/pig/zebra
- เพิ่ม UDFContext ให้ UDF ของวิธีการที่จะส่งผ่านข้อมูลจากด้านหน้าไปด้านหลังสิ้นสุดและจะช่วยให้เข้าถึงการ UDFS JobConf ในแบ็กเอนด์.
- เพิ่มซ้ายด้านนอกเข้าร่วมส่วนซ้ำเข้าร่วม.
- เพิ่มความสามารถในการกำหนดลำดับความสำคัญงานจากละติน.
- ที่เพิ่มขึ้นหลายแบบสอบถามที่จะทำงานกับร่วมในบางกรณี.
- จัดการหน่วยความจำนําเพื่อลดค่าใช้จ่าย GC และออกจากความล้มเหลวของกอง.
- เพิ่มอินเตอร์เฟซสำหรับ UDF ของสะสม.
- กว่า 100 แก้ไขข้อผิดพลาดและการปรับปรุง.
ต้องการ
- Java 1.6.x หรือสูงกว่า
- Apache Hadoop 0.20.x หรือสูงกว่า
ความคิดเห็นที่ไม่พบ