DKPro หลักเป็นซอฟต์แวร์โอเพนซอร์สที่เขียนในภาษาการเขียนโปรแกรม Java และการออกแบบเป็นคอลเลกชันของการใช้งานสำหรับการประมวลผลภาษาธรรมชาติ (NLP)
ในบางส่วนของฟังก์ชั่นที่มีให้โดยส่วนประกอบ DKPro หลักของเราสามารถพูดถึง tokenization การแบ่งส่วนแยกสารประกอบกั้น, Lemmatization เป็นส่วนหนึ่งของการพูดการติดแท็กการวิเคราะห์ลักษณะทางสัณฐานวิทยาการแยกประโยค, แยกพึ่งพาความละเอียด coreference บัตรประจำตัวภาษา, การแก้ไขการสะกดคำ และไวยากรณ์การตรวจสอบ
อยู่บนพื้นฐานของกรอบ Apache UIMA, DKPro หลักโครงการได้รับการพัฒนาขึ้นโดยแพร่หลายความรู้ของการประมวลผล Lab (UKP) ที่ Technische Universit & auml; T Darmstadt, Germany
DKPro หลักกระจายเป็นฉบับแยก DKPro แกน GPL และ DKPro แกน ASL ได้รับใบอนุญาตภายใต้ GPLv3 และ Apache License ซอฟแวร์ แต่ละรุ่นมีชุดคุณลักษณะที่แตกต่างกัน
มีอะไรใหม่ ในข่าวประชาสัมพันธ์ฉบับนี้.
- โมดูล API ใหม่
- api.phonetics - ประเภทหมายเหตุสำหรับระดับออกเสียง
- api.semantics - ประเภทหมายเหตุสำหรับข้อมูลความหมาย (สาขาความหมายและการติดฉลากบทบาทความหมาย)
- ใหม่โมดูล I / O
- io.conll - Reader และนักเขียน CONLL 2006 รูปแบบ
- io.tcf - อ่านและนักเขียนสำหรับรูปแบบ CLARIN TCF
- io.tgrep นักเขียน - สำหรับไฟล์คลัง TGrep2
- io.tiger - อ่านสำหรับรูปแบบเสือ XML
- โมดูลการวิเคราะห์ใหม่
- commonscodec - ถอดรหัสการออกเสียงอยู่บนพื้นฐานของ Apache เดียห้องสมุด Codec
- decompounding - ชุดที่มีความยืดหยุ่นของชิ้นส่วนสำหรับ decompounding ขึ้นอยู่กับการแยกที่แตกต่างกันและขั้นตอนวิธีการจัดอันดับ
- เครื่องมือคู่ - Wrapper สำหรับคู่เครื่องมือชุด
- morpha - Wrapper สำหรับ morpha โหวด / lemmatizer
- mstparser - Wrapper สำหรับ mstparser
- SFST - โมดูลใหม่สำหรับ SFST ตามการวิเคราะห์ลักษณะทางสัณฐานวิทยา
- umlautnormalizer - Normalizer สำหรับ umlauts ในตำราเยอรมัน (ASL)
- ไฮไลท์เพิ่มเติมในข่าวประชาสัมพันธ์นี้ประกอบด้วย:
- เพิ่มการสนับสนุนสำหรับการแก้ไขรุ่นจากที่เก็บระยะไกลที่รันไทม์
- เพิ่มคำอธิบายประกอบ @TypeCapabilities ประกาศซึ่งพวกเขาใช้คำอธิบายประกอบและผลิต
- เพิ่มสร้างขึ้นโดยอัตโนมัติอธิบาย XML สำหรับส่วนประกอบ UIMA (ผ่าน uimafit-Maven ปลั๊กอิน)
- เพิ่มการสนับสนุนสำหรับ ClearNLP หมายฉลากบทบาท
- เพิ่มการสนับสนุนสำหรับ GATE Hepple POS Tagger
- เพิ่มการสนับสนุนสำหรับ parser OpenNLP และค้นหาชื่อ
- อัพเกรด Apache uimaFIT 2.0.0
- อัพเกรด Apache UIMA 2.4.2
- การปรับปรุงเพื่อ ArkTweet-NLP 0.3.2
- อัพเกรด ClearNLP 1.3.1
- อัพเกรด CoreNLP 3.2.0
- อัพเกรด GATE 7.1
- อัพเกรด jweb1t 1.3.0
- อัพเกรด LanguageTool 2.2
- อัพเกรด Maltparser 1.7.2
- อัพเกรด Mate-Tools anna 3.5
- อัพเกรด OpenNLP 1.5.3
- บางโมดูลจะรักษาไม่ได้และไม่ได้รับการพิจารณาในการใช้สำหรับประชาชนทั่วไปเช่น โมดูล io.mmax2 และโมดูล io.wsdl พวกเขาได้รับการถอยออกไปและจะไม่รวมอยู่ในรุ่นนี้.
- เมื่ออัพเกรดโปรดทราบว่าคุณไม่ควรผสมรุ่นที่แตกต่างกันของส่วนประกอบ DKPro พื้นฐานในโครงการของคุณ -. พวกเขาไม่อาจจะเข้ากันได้กับแต่ละอื่น ๆ
ต้องการ
- Java 2 Standard Edition Runtime Environment
ความคิดเห็นที่ไม่พบ