DataFu รับการพัฒนาที่ LinkedIn และเขียนทั้งหมดใน Java.
DataFu รวมถึงฟังก์ชั่น / ห้องสมุดสำหรับการทำงานกับ:
- สถิติ
- การประเมิน
- การสุ่มตัวอย่าง
- การประชุม
- การเชื่อมโยง
- การใช้งานชุด
- กระเป๋า
DataFu เป็นที่สมบูรณ์แบบสำหรับการทำเหมืองข้อมูลและการประยุกต์สถิติการทำงานบนฐานข้อมูล Hadoop หรือหมู.
ฟังก์ชั่นเหล่านี้ช่วยให้นักพัฒนาสามารถใช้ประโยชน์จากข้อมูลทั้งหมดที่เก็บไว้ภายใน Hadoop หรือ หมู ฐานข้อมูลโดยไม่ต้องมีการจัดการกับความต้องการของระบบขนาดใหญ่เพื่อที่จะทำเช่นนั้น
มีอะไรใหม่ ในรุ่นนี้:.
- คู่ UDF ของสำหรับการสุ่มตัวอย่างแบบง่ายด้วยการเปลี่ยน
- การอ้างอิงมากขึ้นในขณะที่บรรจุใน DataFu อ้างอิง JAR ดังนั้นจำเป็นน้อยลง.
- UDF SetDifference สำหรับการคำนวณตั้งความแตกต่าง (เช่น-B หรือ A-B-C).
มีอะไรใหม่ ในรุ่น 1.2.0:
- คู่ UDF ของสำหรับการสุ่มตัวอย่างแบบง่ายด้วยการเปลี่ยน
- การอ้างอิงมากขึ้นในขณะที่บรรจุใน DataFu อ้างอิง JAR ดังนั้นจำเป็นน้อยลง.
- UDF SetDifference สำหรับการคำนวณตั้งความแตกต่าง (เช่น-B หรือ A-B-C).
คืออะไรใหม่ ในรุ่น 1.1.0:.
- เพิ่ม SHA กัญชา UDF
- InUDF และ AssertUDF เพิ่มสำหรับหมู 0.12 ความเข้ากันได้ เหล่านี้เป็นเช่นเดียวกับในและยืนยัน.
- SimpleRandomSample ซึ่งดำเนินขั้นตอนวิธีการสุ่มตัวอย่างแบบง่ายที่สามารถปรับขนาด.
ความคิดเห็นที่ไม่พบ