Apache Lucene

ภาพหน้าจอของซอฟแวร์:
Apache Lucene
รายละเอียดซอฟแวร์:
รุ่น: 5.3.1 / 4.10.4 / 3.6.2 การปรับปรุง
วันที่อัพโหลด: 10 Dec 15
ผู้พัฒนา: Apache Software Foundation
การอนุญาต: ฟรี
ความนิยม: 241

Rating: nan/5 (Total Votes: 0)

Apache Lucene เหมาะสำหรับการใช้งานที่ต้องการการสนับสนุนเพื่อการค้นหาข้อความแบบเต็มใด ๆ ในขณะที่ยังทำให้การใช้ทรัพยากรเซิร์ฟเวอร์ลงและผลิตผลลัพธ์ที่รวดเร็วและความแม่นยำสูง.

Lucene เป็นที่ยอมรับอย่างกว้างขวางว่าเป็นหนึ่งในเครื่องมือค้นหาที่ดีที่สุดรอบเป็นที่หลักของเครื่องมือค้นหาอื่น ๆ อีกมากมายที่เป็นที่มีชื่อเสียงที่สุด Apache Solr .

Lucene เขียนทั้งหมดในเกาะชวาและตั้งแต่ได้รับการปล่อยตัวโดยมูลนิธิอาปาเช่จะได้รับการแจ้งความกับภาษาอื่น ๆ อีกมากมายและการผูกต่างๆและห่ออยู่ในฐานะของบุคคลที่สามการพัฒนาซอฟแวร์.

มีอะไรใหม่ ในข่าวประชาสัมพันธ์ฉบับนี้

  • การเข้าถึงไฟล์ทั้งหมดตอนนี้ใช้ APIs ของ Java NIO.2 ที่ให้ Lucene ดัชนีความปลอดภัยที่แข็งแกร่งในแง่ของการจัดการข้อผิดพลาดที่ดีขึ้นและ กระทำที่ปลอดภัย.
  • ทุกส่วน Lucene ตอนนี้เก็บ ID ไม่ซ้ำกันต่อส่วนต่อและมุ่งมั่นที่จะช่วยในการจำลองแบบที่ถูกต้องของไฟล์ดัชนี.
  • ในระหว่างการรวม IndexWriter ตอนนี้จะตรวจสอบกลุ่มที่เข้ามาสำหรับความเสียหายก่อนจะรวม นี้อาจหมายถึงในการอัพเกรดเป็น 5.0.0 ผสานที่อาจค้นพบการทุจริตแฝงยาวนานในดัชนี 4.x เก่า.

มีอะไรใหม่ ในรุ่น 5.2.1 / 4.10.4 / 3.6.2:

  • ไฟล์ทั้งหมด ตอนนี้ใช้การเข้าถึง APIs ของ Java NIO.2 ที่ให้ Lucene ดัชนีความปลอดภัยที่แข็งแกร่งในแง่ของการจัดการข้อผิดพลาดที่ดีขึ้นและปลอดภัยมากขึ้นกระทำ.
  • ทุกส่วน Lucene ตอนนี้เก็บ ID ไม่ซ้ำกันต่อส่วนต่อและมุ่งมั่นที่จะช่วยในการจำลองแบบที่ถูกต้องของไฟล์ดัชนี.
  • ในระหว่างการรวม IndexWriter ตอนนี้จะตรวจสอบกลุ่มที่เข้ามาสำหรับความเสียหายก่อนจะรวม นี้อาจหมายถึงในการอัพเกรดเป็น 5.0.0 ผสานที่อาจค้นพบการทุจริตแฝงยาวนานในดัชนี 4.x เก่า.

มีอะไรใหม่ ในรุ่น 5.1.0 / 4.10.4 / 3.6.2:

  • ไฟล์ทั้งหมด ตอนนี้ใช้การเข้าถึง APIs ของ Java NIO.2 ที่ให้ Lucene ดัชนีความปลอดภัยที่แข็งแกร่งในแง่ของการจัดการข้อผิดพลาดที่ดีขึ้นและปลอดภัยมากขึ้นกระทำ.
  • ทุกส่วน Lucene ตอนนี้เก็บ ID ไม่ซ้ำกันต่อส่วนต่อและมุ่งมั่นที่จะช่วยในการจำลองแบบที่ถูกต้องของไฟล์ดัชนี.
  • ในระหว่างการรวม IndexWriter ตอนนี้จะตรวจสอบกลุ่มที่เข้ามาสำหรับความเสียหายก่อนจะรวม นี้อาจหมายถึงในการอัพเกรดเป็น 5.0.0 ผสานที่อาจค้นพบการทุจริตแฝงยาวนานในดัชนี 4.x เก่า.

มีอะไรใหม่ ในรุ่น 5.0.0 / 4.10.3 / 3.6.2:

  • ข้อตกลงใหม่ .getMin / แม็กซ์วิธีการที่จะดึงข้อตกลงต่ำสุดและสูงสุดต่อสนาม.
  • ใหม่ IDVersionPostingsFormat เหมาะสำหรับการค้นหา ID ที่เชื่อมโยงรุ่น monotonically เพิ่มขึ้นต่อ ID.
  • ปรับปรุงอะตอมของชุดของเอกสารค่าสาขา.
  • การเพิ่มประสิทธิภาพมากมายสำหรับ doc ค่าประสิทธิภาพเวลาค้นหา.
  • ใหม่ (เริ่มต้น) Lucene49NormsFormat ที่ดีกว่าการบีบอัดบางกรณีเช่นสาขาที่สั้นมาก.
  • ประเภทใหม่ SORTED_NUMERIC docvalues​​ สำหรับการประมวลผลที่มีประสิทธิภาพของเขตข้อมูลที่เป็นตัวเลขหลายค่า.
  • ดัชนีผ่านกระแสโทเค็นก่อนหน้านี้สำหรับนำมาใช้ใหม่ได้ง่ายขึ้น.
  • MoreLikeThis ยอมรับค่าหลายต่อสนาม.
  • ทุกชั้นเรียนที่ประเมินการใช้ RAM ของพวกเขาในขณะนี้ใช้อินเตอร์เฟซที่รับผิดชอบใหม่.
  • ไฟล์ Lucene ถูกเขียนโดยขณะนี้ (File) OutputStream บนแพลตฟอร์มทั้งหมดสมบูรณ์ไม่อนุญาตให้มีการแสวงหา APIs IO ง่าย.
  • การปรับปรุงข้อผิดพลาดสับสนเมื่อ MMapDirectory ไม่สามารถสร้างแผนที่ใหม่.

มีอะไรใหม่ ในรุ่น 4.8.0:

  • Lucene มีใหม่ Rescorer / QueryRescorer API ที่จะดำเนินการ rescoring สองผ่านหรือ reranking ของผลการค้นหาโดยใช้ฟังก์ชั่นการให้คะแนนที่มีราคาแพงมากขึ้นหลังจากครั้งแรกผ่านคอลเลกชัน.
  • AnalyzingInfixSuggester ขณะนี้สนับสนุนใกล้เวลาจริง autosuggest.
  • ประยุกต์การโพสต์ผลกระทบเรียง (ใช้ SortingMergePolicy และ EarlyTerminatingCollector) เพื่อใช้จัดเรียงชั้น Lucene เพื่อแสดงลำดับการจัดเรียง.
  • การให้คะแนนเป็นกลุ่มปกติและเกณฑ์การให้คะแนนตาม iterator ถูกแยกออกเพื่อให้คำสั่งบางอย่างสามารถทำคะแนนจำนวนมากได้อย่างมีประสิทธิภาพ.
  • เปลี่ยนไป MurmurHash3 จะสับเงื่อนไขในระหว่างการจัดทำดัชนี.
  • IndexWriter ในขณะนี้สนับสนุนการปรับปรุงฟิลด์ค่า doc ไบนารี.
  • HunspellStemFilter ตอนนี้ใช้ 10 ถึง 100x RAM น้อย นอกจากนี้ยังเป็นที่รู้จักกันทั้งหมดโหลดพจนานุกรม OpenOffice ไม่มีข้อผิดพลาด.
  • Lucene ตอนนี้ยัง fsyncs เมตาดาต้าไดเรกทอรีบนกระทำถ้าระบบปฏิบัติการและระบบไฟล์อนุญาต (Linux, MacOSX เป็นที่รู้จักกันในการทำงาน).
  • Lucene ตอนนี้ใช้ฟังก์ชั่นระบบไฟล์ Java 7 ภายใต้ประทุนดังนั้นไฟล์ดัชนีสามารถลบได้บน Windows, แม้ในขณะที่ผู้อ่านยังคงเปิด.
  • ข้อผิดพลาดร้ายแรงใน NativeFSLockFactory ถูกแก้ไขซึ่งอาจทำให้หลาย IndexWriters ที่จะได้รับล็อคเดียวกัน ล็อคไฟล์จะถูกลบออกไม่ได้จากไดเรกทอรีดัชนีแม้ในขณะที่ล็อคไม่ได้ถูกจัดขึ้น.

มีอะไรใหม่ ในรุ่น 4.7.0:

  • เมื่อเรียงลำดับตามสตริง (SortField.STRING) ตอนนี้คุณสามารถระบุได้ว่าค่าที่ขาดหายไปควรจะเรียงแรก (เริ่มต้น) หรือที่ผ่านมา.
  • NRT สนับสนุนสำหรับระบบไฟล์ที่ไม่ได้ลบในใกล้ที่ผ่านมาหรือไม่สามารถลบในขณะที่ความหมายอ้างอิง.
  • เพิ่ม LongBitSet สำหรับการจัดการมากกว่า 2.1B บิต (มิฉะนั้นใช้ FixedBitSet).
  • เพิ่มวิเคราะห์สำหรับดิช.
  • เพิ่มการสนับสนุนอัตราการ FileDictionary (แนะนำ) และทำให้มันมากขึ้นที่กำหนด.
  • เพิ่ม BlendedInfixSuggester ใหม่ซึ่งเป็นเหมือน AnalyzingInfixSuggester แต่ช่วยเพิ่มคำแนะนำที่ตรงกับสัญญาณที่มีตำแหน่งต่ำกว่า.
  • เพิ่ม SimpleQueryParser. parser สำหรับการค้นหาของมนุษย์เข้ามา
  • เพิ่ม multitermquery (สัญลักษณ์คำนำหน้า, ฯลฯ ) เพื่อ PostingsHighlighter.

มีอะไรใหม่ ในรุ่น 4.6.0:

  • เพิ่มการสนับสนุนสำหรับการปรับปรุง NumericDocValues​​ สาขา (ไม่รวมอีกครั้ง ดัชนีเอกสาร) ผ่าน IndexWriter.updateNumericDocValue (ระยะสตริงยาว).
  • ใหม่ FreeTextSuggester สามารถคาดการณ์คำถัดไปโดยใช้แบบจำลอง ngram ภาษาที่เรียบง่ายที่มีประโยชน์สำหรับ & quot; หางยาว & quot; ข้อเสนอแนะ.
  • โมดูลการแสดงออกใหม่ช่วยให้การปรับแต่งการจัดอันดับที่มีไวยากรณ์สคริปต์เหมือน.
  • DirectDocValues​​Format ใหม่ที่สามารถถือทั้งค่าเอกสารในกองเป็นอาร์เรย์พื้นเมืองจาวาไม่มีการบีบอัด.
  • Term.hasFreqs ขณะนี้สามารถระบุได้ว่าสนามที่ได้รับการจัดทำดัชนีต่อ doc
  • ความถี่ระยะ.

มีอะไรใหม่ ในรุ่น 4.5.0:

  • ใหม่ในหน่วยความจำการใช้งาน DocIdSet ที่ดีขึ้นโดยเฉพาะอย่างยิ่ง กว่า FixedBitSet ชุดเล็ก:. WAH8DocIdSet, PFORDeltaDocIdSet และ EliasFanoDocIdSet
  • CachingWrapperFilter ตอนนี้มีตัวกรองแคช WAH8DocIdSet โดยค่าเริ่มต้นที่มีการใช้หน่วยความจำเช่นเดียวกับ FixedBitSet ในกรณีที่เลวร้ายที่สุด แต่มีขนาดเล็กและเร็วขึ้นในชุดขนาดเล็ก.
  • TokenStreams ชุดนี้เพิ่มตำแหน่งในที่สุด () เพื่อให้เราสามารถจัดการกับหลุมต่อท้าย.
  • IndexWriter ไม่โคลนที่กำหนด IndexWriterConfig.
  • bugfixes ต่าง ๆ และการเพิ่มประสิทธิภาพตั้งแต่การเปิดตัว 4.4.

มีอะไรใหม่ ในรุ่น 4.4.0:

  • โมดูลใหม่ซ้ำ: ทำซ้ำแก้ไขดัชนีระหว่างเซิร์ฟเวอร์และ ลูกค้า.
  • ใหม่ AnalyzingInfixSuggester. พบว่าข้อเสนอแนะในการแข่งขันตามที่จะสัญญาณใด ๆ ในข้อเสนอแนะที่ไม่ได้ขึ้นอยู่เพียงแค่ในการจับคู่คำนำหน้าบริสุทธิ์
  • ใหม่ PatternCaptureGroupTokenFilter. ปล่อยสัญญาณหลายอย่างใดอย่างหนึ่งสำหรับแต่ละกลุ่มจับภาพในหนึ่งหรือมากกว่า regexes Java
  • โมดูลใหม่ Lucene Facet.

มีอะไรใหม่ ในรุ่น 4.3.0:

  • ใหม่ SearcherTaxonomyManager จัดการใกล้เวลาจริงกลับมาคึกคักของ ทั้ง IndexSearcher และ TaxonomyReader (สำหรับ faceting).
  • วิธีการเพิ่มแง่มุมใหม่ที่จะโมดูลด้านการคำนวณด้านนับ SortedSetDocValues​​Field ใช้โดยไม่ต้องดัชนีอนุกรมวิธานแยกต่างหาก.
  • การปรับปรุงประสิทธิภาพอย่างมีนัยสำคัญสำหรับ minShouldMatch BooleanQuery เนื่องจากการกระโดดข้ามส่งผลให้ได้ถึง 4000% คำสั่งได้เร็วขึ้น.
  • bugfixes ต่าง ๆ และการเพิ่มประสิทธิภาพตั้งแต่การเปิดตัว 4.2.1.

มีอะไรใหม่ ในรุ่น 4.1.0:

  • Lucene ไม่พยายามที่เมื่อเขียนไฟล์ (ทุกสาขา ถูกเขียนในทางที่ผนวกเท่านั้น) ซึ่งหมายความว่ามันทำงานโดยเริ่มต้นด้วยการผนวกเท่านั้นลำธาร HDFS ฯลฯ ..
  • ใหม่แนะนำการใช้งาน: AnalyzingSuggester ที่รูปแบบพื้นฐาน (คำนวณจาก lucene วิเคราะห์) ใช้สำหรับข้อเสนอแนะที่จะแยกจากข้อความกลับและ FuzzySuggester ซึ่งนอกจากจะช่วยให้สำหรับการจับคู่ไม่แน่นอนในการป้อนข้อมูล
  • .
  • การสนับสนุนใกล้เรียลไทม์ถูกบันทึกอยู่ในโมดูลด้านได้.
  • ใหม่เน้น (postingshighlighter) เพิ่มโมดูลเน้นได้.
  • เพิ่ม FilterStrategy FilteredQuery เพื่อให้มีความยืดหยุ่นมากขึ้นในการดำเนินการแบบสอบถามกรอง.
  • เพิ่ม CommonTermsQuery เพื่อเพิ่มความเร็วในคำสั่งที่มีเงื่อนไขบ่อยอย่างมาก ความถี่ระยะที่ตรวจพบได้อย่างมีประสิทธิภาพในเวลาแบบสอบถาม -. การจัดทำดัชนีเวลาไม่จำเป็นต้องใช้
  • bugfixes หลายและการเพิ่มประสิทธิภาพตั้งแต่รุ่น 4.0.

มีอะไรใหม่ ในรุ่น 4.0 อัลฟา:

  • รูปแบบดัชนีสำหรับคำที่รายการโพสต์ที่เก็บไว้ ทุ่งคำ
  • เวกเตอร์ ฯลฯ pluggable ผ่าน Codec API คุณสามารถเลือกจากการใช้งานที่ให้มาหรือปรับแต่งรูปแบบดัชนีที่มีตัวแปลงสัญญาณของคุณเองเพื่อตอบสนองความต้องการของคุณ.
  • ผลการดำเนินงานอย่างมีนัยสำคัญได้เร็วขึ้นเมื่อใช้ตัวกรองในระหว่างการค้นหา.
  • ไฟล์ระบบไดเรกทอรีที่ใช้สามารถประเมิน-IO จำกัด (MB / วินาที) หัวข้อผสานเพื่อลดความขัดแย้งระหว่าง IO การควบรวมกิจการและการค้นหาหัวข้อ.
  • FuzzyQuery เป็น 100-200 ครั้งเร็วกว่าในรุ่นที่ผ่านมา.
  • ตรวจสอบการสะกดใหม่ DirectSpellChecker พบว่าการแก้ไขที่เป็นไปได้
  • โดยตรงกับดัชนีการค้นหาหลักโดยไม่ต้องมีดัชนีที่แยกต่างหาก.

มีอะไรใหม่ ในรุ่น 3.6.0:

  • นอกจาก Java 5 และ Java 6 นี้ การเปิดตัวเต็มรูปแบบได้ในขณะนี้การสนับสนุน Java 7 (ขั้นต่ำ 7u1 JDK จำเป็น).
  • TypeTokenFilter กรองสัญญาณขึ้นอยู่กับ TypeAttribute ของพวกเขา.
  • ข้อบกพร่องคงชดเชยในจำนวนของ CharFilters, Tokenizers และ TokenFilters ที่อาจนำไปสู่​​ข้อยกเว้นในช่วงไฮไลท์.
  • เพิ่มเข้ารหัสการออกเสียง: Metaphone, Soundex, Caverphone, Beider-มอร์ส ฯลฯ
  • .
  • CJKBigramFilter และ CJKWidthFilter แทนที่ CJKTokenizer.
  • Kuromoji วิเคราะห์ลักษณะทางสัณฐานวิทยา tokenizes ข้อความภาษาญี่ปุ่น, การผลิตทั้งคำประสมและการแบ่งส่วนของพวกเขา.
  • การตัดแต่งกิ่งดัชนีแบบคงที่ (คาร์เมลตัดแต่งกิ่ง) ลบโพสต์ที่มีระดับต่ำภายในเอกสารความถี่ระยะ.
  • QueryParser ตอนนี้ตีความ '*' เป็นปลายเปิดสำหรับการค้นหาช่วง.
  • FieldValueFilter ไม่รวมเอกสารหายไปสาขาที่ระบุ.
  • CheckIndex IndexUpgrader และช่วยให้คุณสามารถระบุการดำเนิน FSDirectory ที่เฉพาะเจาะจงที่จะใช้กับใหม่ -dir-Impl ตัวเลือกบรรทัดคำสั่ง.
  • FSTs ตอนนี้สามารถทำค้นหาแบบย้อนกลับ (โดยการส่งออก) ในบางกรณีและสามารถบรรจุเพื่อลดขนาดของพวกเขา ตอนนี้จะมีวิธีการที่จะดึงบน N เส้นทางที่สั้นที่สุดจากโหนดเริ่มต้นใน FST.
  • ใหม่ WFSTCompletionLookup Suggester สนับสนุนการจัดอันดับที่ดีกว่าเม็ดเล็กสำหรับข้อเสนอแนะ.
  • FST ตาม suggesters ตอนนี้ใช้แบบออฟไลน์ (ดิสก์) เรียงลำดับแทนของการจัดเรียงในหน่วยความจำเมื่อก่อนการเรียงลำดับคำแนะนำ.
  • ToChildBlockJoinQuery ร่​​วมในทิศทางตรงกันข้าม (แม่ลงไปที่เด็กเอกสาร).
  • แบบสอบถามเวลาใหม่มาร่วมงานมีความยืดหยุ่นมากขึ้น (แต่น้อย performant กว่า) ดัชนีเวลาร่วม.
  • เพิ่ม HTMLStripCharFilter ที่จะตัดมาร์กอัป HTML.

มีอะไรใหม่ ในรุ่น 3.5.0:

  • เพิ่มที่สำคัญมาก (3-5X) RAM ลดต้องถือดัชนีเงื่อนไขเกี่ยวกับการเปิด IndexReader.
  • เพิ่ม IndexSearcher.searchAfter ซึ่งผลลัพธ์หลังจาก ScoreDoc ระบุ (เช่นเอกสารล่าสุดเมื่อวันที่หน้าก่อนหน้า) เพื่อสนับสนุนเพจกรณีการใช้งานลึก.
  • เพิ่ม SearcherManager การจัดการร่วมกันและเปิด IndexSearchers ทั่วหัวข้อค้นหาหลาย กรณี IndexReader อ้างอิงจะปิดได้อย่างปลอดภัยหากไม่ได้อ้างอิงอีกต่อไป.
  • เพิ่ม SearcherLifetimeManager ที่ปลอดภัยให้มุมมองที่สอดคล้องกันของดัชนีระหว่างการร้องขอหลาย ๆ (เช่นเพจ / เจาะลึก).
  • เปลี่ยนชื่อ IndexWriter.optimize forceMerge เพื่อที่จะกีดกันการใช้วิธีนี้เพราะมันจะเป็นค่าใช้จ่ายอย่างน่ากลัวและไม่ค่อยเป็นธรรมอีกต่อไป.

มีอะไรใหม่ ในรุ่น 3.3.0:

  • โมดูลเช็คคำสะกดขณะนี้รวมถึงแนะนำ / อัตโนมัติสมบูรณ์ ฟังก์ชั่นการใช้งานที่มีสาม:. Jaspell, Ternary Trie และรัฐ จำกัด
  • การสนับสนุนสำหรับการรวมผลที่ได้จากเศษหลายทั้ง & quot; ปกติ & quot; ผลการค้นหา (TopDocs.merge) เช่นเดียวกับผลการจัดกลุ่มโดยใช้โมดูลการจัดกลุ่ม (SearchGroup.merge, TopGroups.merge).
  • การดำเนินการเพิ่มประสิทธิภาพของ KStem เป็น Stemmer ก้าวร้าวน้อยสำหรับภาษาอังกฤษ.
  • การจัดกลุ่มเดียวผ่านการดำเนินการจัดทำดัชนีขึ้นอยู่กับบล็อกเอกสาร.
  • การปรับปรุง MMapDirectory (ตอนนี้ยังใช้งานเริ่มต้นที่ส่งกลับโดย FSDirectory.open บน Linux 64 บิต).
  • NRTManager ช่วยลดความยุ่งยากในการจัดการใกล้เวลาจริงการค้นหาที่มีหัวข้อการค้นหาหลายที่ช่วยให้การประยุกต์ใช้ในการควบคุมการเปลี่ยนแปลงการจัดทำดัชนีจะต้องมองเห็นที่คำขอการค้นหา.
  • TwoPhaseCommitTool อำนวยความสะดวกในการดำเนินการเป็นทรัพยากรที่หลายสองค่อย ๆ กระทำรวมทั้ง IndexWriter.
  • นโยบายผสานค่าเริ่มต้น TieredMergePolicy มีวิธีการใหม่ (ชุด / getReclaimDeletesWeight) เพื่อควบคุมวิธีการเชิงรุกกลุ่มเป้าหมายที่มีการลบและเป็นเชิงรุกมากขึ้นกว่า แต่ก่อนโดยค่าเริ่มต้น.
  • เครื่องมือ PKIndexSplitter แยกดัชนีโดยระยะกลางจุด.

มีอะไรใหม่ ในรุ่น 3.2.0:

  • โมดูลการจัดกลุ่มใหม่ภายใต้ lucene / contrib / การจัดกลุ่มจะช่วยให้ผลการค้นหาจะถูกจัดกลุ่มเป็นหนึ่งเดียวที่มีมูลค่าการจัดทำดัชนีสนาม.
  • เครื่องมือ IndexUpgrader ใหม่อย่างเต็มที่แปลงดัชนีเก่าไปยังรูปแบบปัจจุบัน.
  • การดำเนินไดเรกทอรีใหม่ NRTCachingDirectory, แคชส่วนเล็ก ๆ ในหน่วยความจำเพื่อลด I / O โหลดสำหรับการใช้งานได้อย่างรวดเร็วด้วยการเปิดอัตรา NRT.
  • การดำเนินงานสะสมใหม่ CachingCollector คือสามารถที่จะรวบรวมเพลงฮิตค้นหา (รหัสเอกสารและเลือกที่จะยังคะแนน) และจากนั้นพวกเขาเล่น นี้จะเป็นประโยชน์สำหรับนักสะสมที่ต้องใช้สองคนหรือมากกว่าที่ผ่านมาจะให้ผลลัพธ์ที่.
  • ดัชนีบล็อกเอกสารโดยใช้ IndexWriter ของ addDocuments ใหม่หรือวิธีการ updateDocuments เหล่านี้ API สำหรับการทดลองให้แน่ใจว่าบล็อกของเอกสารตลอดไปจะยังคงอยู่ต่อเนื่องกันในดัชนีที่ช่วยให้อนาคตที่น่าสนใจเช่นการจัดกลุ่มมีและร่วม.
  • นโยบายผสานเริ่มต้นใหม่ TieredMergePolicy ซึ่งมีประสิทธิภาพมากขึ้นเนื่องจากความสามารถในการรวมกลุ่มที่ไม่อยู่ติดกัน.
  • NumericField จะถูกส่งกลับในขณะนี้ได้อย่างถูกต้องเมื่อคุณโหลดเอกสารที่เก็บไว้ (ก่อนหน้านี้คุณได้รับสนามปกติกลับมีค่าตัวเลขสตริงแปลง).

มีอะไรใหม่ ในรุ่น 3.1.0:.

  • ConstantScoreQuery ในขณะนี้ช่วยให้การตัดโดยตรงแบบสอบถาม
  • IndexWriter มีการกำหนดค่าในขณะนี้กับผู้สร้างแยกต่างหาก API ใหม่, IndexWriterConfig ตอนนี้คุณสามารถควบคุมวงเงินกระทู้ภายใน IndexWriter คงก่อนหน้านี้โดยการเรียก setMaxThreadStates.
  • IndexWriter.getReader จะถูกแทนที่ด้วย IndexReader.open (IndexWriter) นอกจากนี้คุณสามารถระบุได้ว่าลบควรจะแก้ไขเมื่อคุณเปิดอ่าน NRT.
  • MultiSearcher จะเลิก; ParallelMultiSearcher ได้รับการดูดซึมโดยตรงใน IndexSearcher.
  • ใน 64bit Windows และ Solaris JVMs, MMapDirectory อยู่ในขณะนี้การดำเนินงานเริ่มต้น (ส่งกลับโดย FSDirectory.open) MMapDirectory ยังช่วยให้ unmapping ถ้า JVM ที่สนับสนุน.
  • ใหม่ TotalHitCountCollector เพียงแค่นับจำนวนของการเข้าชม.
  • ReaderFinishedListener API ช่วยให้แคชภายนอกที่จะขับไล่รายการครั้งหนึ่งเคยเป็นส่วนที่จะเสร็จสิ้น.

มีอะไรใหม่ ในรุ่น 3.0.1:.

  • ลบที่ไม่จำเป็นในการประสาน FuzzyTermEnum
  • เมื่อการแก้ไขแง่ลบทำในลำดับการจัดเรียงยาวสำหรับประสิทธิภาพที่ดีขึ้น.
  • อย่าให้ถูกต้องคำเตือนเกี่ยวกับระยะเดียวกันอันยิ่งใหญ่เมื่อ IndexWriter.infoStream อยู่บน.
  • แก้ไข Min / MaxPayloadFunction กลับ 0 เมื่อเพียงหนึ่งบรรจุเป็นปัจจุบัน.
  • แบบสอบถามประกอบด้วยทุกคำสั่งศูนย์เพิ่ม (ตัวอย่างเช่นข้อความ: foo ^ 0) เรียงไม่ถูกต้องและไม่ถูกต้องผลิต docids
  • .
  • ถอด ScoreTerm ระดับชั้นป้องกันจาก FuzzyQuery การเปลี่ยนแปลงเป็นสิ่งที่จำเป็นเพราะเปรียบเทียบของชั้นนี้ได้มีการเปลี่ยนแปลงในทางที่เข้ากันไม่ได้ ชั้นก็ไม่เคยตั้งใจจะให้ประชาชน.

สิ่งที่ใหม่ ในรุ่น 2.9.2:

  • BooleanQuery ถูกละเลย disableCoord ใน hashCode และเท่ากับวิธีการ ก่อให้เกิดสิ่งที่ไม่ดีที่จะเกิดขึ้นเมื่อแคช BooleanQueries.
  • อย่าให้ถูกต้องคำเตือนเกี่ยวกับระยะเดียวกันอันยิ่งใหญ่เมื่อ IndexWriter.infoStream อยู่บน.
  • การจัดทำดัชนีในอัตราสูงอ่าน NRT ชั่วคราวอาจสูญเสียการลบ.

มีอะไรใหม่ ในรุ่น 3.0.0:

  • ลบสถานที่ให้บริการระบบการตั้งค่าการใช้งานระดับ SegmentReader
  • เปลี่ยนประเภทการกลับมาของภาพรวม SnapshotDeletionPolicy # () จาก IndexCommitPoint เพื่อ IndexCommit รหัสที่ใช้วิธีการนี​​้จะต้อง recompiled กับ Lucene 3.0 เพื่อที่จะทำงาน เลิกก่อนหน้านี้จะถูกลบออก IndexCommitPoint ยัง.
  • ให้ AttributeFactory ที่สร้างความสะดวกสบายเช่น Token สำหรับคุณลักษณะพื้นฐานทั้งหมด.
  • ลบเรียกซ้ำใน NumericRangeTermEnum.
  • เพิ่มประสิทธิภาพการคำนวณระยะทาง Levenshtein ใน FuzzyQuery.

ซอฟต์แวร์ที่คล้ายกัน

Anemone
Anemone

12 May 15

Lupyne
Lupyne

13 Apr 15

Zoie
Zoie

13 May 15

Sphinx
Sphinx

12 May 15

ซอฟแวร์อื่น ๆ ของนักพัฒนา Apache Software Foundation

Apache Flume
Apache Flume

4 Jun 15

Apache Oltu
Apache Oltu

10 Dec 15

Apache Olingo
Apache Olingo

20 Jul 15

Apache Blur
Apache Blur

13 Apr 15

ความคิดเห็นที่ Apache Lucene

ความคิดเห็นที่ไม่พบ
เพิ่มความคิดเห็น
เปิดภาพ!
ค้นหาตามหมวดหมู่