Apache Lucene

ภาพหน้าจอของซอฟแวร์:
Apache Lucene
รายละเอียดซอฟแวร์:
รุ่น: 5.3.1 / 4.10.4 / 3.6.2 การปรับปรุง
วันที่อัพโหลด: 10 Dec 15
ผู้พัฒนา: Apache Software Foundation
การอนุญาต: ฟรี
ความนิยม: 241

Rating: nan/5 (Total Votes: 0)

Apache Lucene เหมาะสำหรับการใช้งานที่ต้องการการสนับสนุนเพื่อการค้นหาข้อความแบบเต็มใด ๆ ในขณะที่ยังทำให้การใช้ทรัพยากรเซิร์ฟเวอร์ลงและผลิตผลลัพธ์ที่รวดเร็วและความแม่นยำสูง.

Lucene เป็นที่ยอมรับอย่างกว้างขวางว่าเป็นหนึ่งในเครื่องมือค้นหาที่ดีที่สุดรอบเป็นที่หลักของเครื่องมือค้นหาอื่น ๆ อีกมากมายที่เป็นที่มีชื่อเสียงที่สุด Apache Solr .

Lucene เขียนทั้งหมดในเกาะชวาและตั้งแต่ได้รับการปล่อยตัวโดยมูลนิธิอาปาเช่จะได้รับการแจ้งความกับภาษาอื่น ๆ อีกมากมายและการผูกต่างๆและห่ออยู่ในฐานะของบุคคลที่สามการพัฒนาซอฟแวร์.

มีอะไรใหม่ ในข่าวประชาสัมพันธ์ฉบับนี้

  • การเข้าถึงไฟล์ทั้งหมดตอนนี้ใช้ APIs ของ Java NIO.2 ที่ให้ Lucene ดัชนีความปลอดภัยที่แข็งแกร่งในแง่ของการจัดการข้อผิดพลาดที่ดีขึ้นและ กระทำที่ปลอดภัย.
  • ทุกส่วน Lucene ตอนนี้เก็บ ID ไม่ซ้ำกันต่อส่วนต่อและมุ่งมั่นที่จะช่วยในการจำลองแบบที่ถูกต้องของไฟล์ดัชนี.
  • ในระหว่างการรวม IndexWriter ตอนนี้จะตรวจสอบกลุ่มที่เข้ามาสำหรับความเสียหายก่อนจะรวม นี้อาจหมายถึงในการอัพเกรดเป็น 5.0.0 ผสานที่อาจค้นพบการทุจริตแฝงยาวนานในดัชนี 4.x เก่า.

มีอะไรใหม่ ในรุ่น 5.2.1 / 4.10.4 / 3.6.2:

  • ไฟล์ทั้งหมด ตอนนี้ใช้การเข้าถึง APIs ของ Java NIO.2 ที่ให้ Lucene ดัชนีความปลอดภัยที่แข็งแกร่งในแง่ของการจัดการข้อผิดพลาดที่ดีขึ้นและปลอดภัยมากขึ้นกระทำ.
  • ทุกส่วน Lucene ตอนนี้เก็บ ID ไม่ซ้ำกันต่อส่วนต่อและมุ่งมั่นที่จะช่วยในการจำลองแบบที่ถูกต้องของไฟล์ดัชนี.
  • ในระหว่างการรวม IndexWriter ตอนนี้จะตรวจสอบกลุ่มที่เข้ามาสำหรับความเสียหายก่อนจะรวม นี้อาจหมายถึงในการอัพเกรดเป็น 5.0.0 ผสานที่อาจค้นพบการทุจริตแฝงยาวนานในดัชนี 4.x เก่า.

มีอะไรใหม่ ในรุ่น 5.1.0 / 4.10.4 / 3.6.2:

  • ไฟล์ทั้งหมด ตอนนี้ใช้การเข้าถึง APIs ของ Java NIO.2 ที่ให้ Lucene ดัชนีความปลอดภัยที่แข็งแกร่งในแง่ของการจัดการข้อผิดพลาดที่ดีขึ้นและปลอดภัยมากขึ้นกระทำ.
  • ทุกส่วน Lucene ตอนนี้เก็บ ID ไม่ซ้ำกันต่อส่วนต่อและมุ่งมั่นที่จะช่วยในการจำลองแบบที่ถูกต้องของไฟล์ดัชนี.
  • ในระหว่างการรวม IndexWriter ตอนนี้จะตรวจสอบกลุ่มที่เข้ามาสำหรับความเสียหายก่อนจะรวม นี้อาจหมายถึงในการอัพเกรดเป็น 5.0.0 ผสานที่อาจค้นพบการทุจริตแฝงยาวนานในดัชนี 4.x เก่า.

มีอะไรใหม่ ในรุ่น 5.0.0 / 4.10.3 / 3.6.2:

  • ข้อตกลงใหม่ .getMin / แม็กซ์วิธีการที่จะดึงข้อตกลงต่ำสุดและสูงสุดต่อสนาม.
  • ใหม่ IDVersionPostingsFormat เหมาะสำหรับการค้นหา ID ที่เชื่อมโยงรุ่น monotonically เพิ่มขึ้นต่อ ID.
  • ปรับปรุงอะตอมของชุดของเอกสารค่าสาขา.
  • การเพิ่มประสิทธิภาพมากมายสำหรับ doc ค่าประสิทธิภาพเวลาค้นหา.
  • ใหม่ (เริ่มต้น) Lucene49NormsFormat ที่ดีกว่าการบีบอัดบางกรณีเช่นสาขาที่สั้นมาก.
  • ประเภทใหม่ SORTED_NUMERIC docvalues​​ สำหรับการประมวลผลที่มีประสิทธิภาพของเขตข้อมูลที่เป็นตัวเลขหลายค่า.
  • ดัชนีผ่านกระแสโทเค็นก่อนหน้านี้สำหรับนำมาใช้ใหม่ได้ง่ายขึ้น.
  • MoreLikeThis ยอมรับค่าหลายต่อสนาม.
  • ทุกชั้นเรียนที่ประเมินการใช้ RAM ของพวกเขาในขณะนี้ใช้อินเตอร์เฟซที่รับผิดชอบใหม่.
  • ไฟล์ Lucene ถูกเขียนโดยขณะนี้ (File) OutputStream บนแพลตฟอร์มทั้งหมดสมบูรณ์ไม่อนุญาตให้มีการแสวงหา APIs IO ง่าย.
  • การปรับปรุงข้อผิดพลาดสับสนเมื่อ MMapDirectory ไม่สามารถสร้างแผนที่ใหม่.

มีอะไรใหม่ ในรุ่น 4.8.0:

  • Lucene มีใหม่ Rescorer / QueryRescorer API ที่จะดำเนินการ rescoring สองผ่านหรือ reranking ของผลการค้นหาโดยใช้ฟังก์ชั่นการให้คะแนนที่มีราคาแพงมากขึ้นหลังจากครั้งแรกผ่านคอลเลกชัน.
  • AnalyzingInfixSuggester ขณะนี้สนับสนุนใกล้เวลาจริง autosuggest.
  • ประยุกต์การโพสต์ผลกระทบเรียง (ใช้ SortingMergePolicy และ EarlyTerminatingCollector) เพื่อใช้จัดเรียงชั้น Lucene เพื่อแสดงลำดับการจัดเรียง.
  • การให้คะแนนเป็นกลุ่มปกติและเกณฑ์การให้คะแนนตาม iterator ถูกแยกออกเพื่อให้คำสั่งบางอย่างสามารถทำคะแนนจำนวนมากได้อย่างมีประสิทธิภาพ.
  • เปลี่ยนไป MurmurHash3 จะสับเงื่อนไขในระหว่างการจัดทำดัชนี.
  • IndexWriter ในขณะนี้สนับสนุนการปรับปรุงฟิลด์ค่า doc ไบนารี.
  • HunspellStemFilter ตอนนี้ใช้ 10 ถึง 100x RAM น้อย นอกจากนี้ยังเป็นที่รู้จักกันทั้งหมดโหลดพจนานุกรม OpenOffice ไม่มีข้อผิดพลาด.
  • Lucene ตอนนี้ยัง fsyncs เมตาดาต้าไดเรกทอรีบนกระทำถ้าระบบปฏิบัติการและระบบไฟล์อนุญาต (Linux, MacOSX เป็นที่รู้จักกันในการทำงาน).
  • Lucene ตอนนี้ใช้ฟังก์ชั่นระบบไฟล์ Java 7 ภายใต้ประทุนดังนั้นไฟล์ดัชนีสามารถลบได้บน Windows, แม้ในขณะที่ผู้อ่านยังคงเปิด.
  • ข้อผิดพลาดร้ายแรงใน NativeFSLockFactory ถูกแก้ไขซึ่งอาจทำให้หลาย IndexWriters ที่จะได้รับล็อคเดียวกัน ล็อคไฟล์จะถูกลบออกไม่ได้จากไดเรกทอรีดัชนีแม้ในขณะที่ล็อคไม่ได้ถูกจัดขึ้น.

มีอะไรใหม่ ในรุ่น 4.7.0:

  • เมื่อเรียงลำดับตามสตริง (SortField.STRING) ตอนนี้คุณสามารถระบุได้ว่าค่าที่ขาดหายไปควรจะเรียงแรก (เริ่มต้น) หรือที่ผ่านมา.
  • NRT สนับสนุนสำหรับระบบไฟล์ที่ไม่ได้ลบในใกล้ที่ผ่านมาหรือไม่สามารถลบในขณะที่ความหมายอ้างอิง.
  • เพิ่ม LongBitSet สำหรับการจัดการมากกว่า 2.1B บิต (มิฉะนั้นใช้ FixedBitSet).
  • เพิ่มวิเคราะห์สำหรับดิช.
  • เพิ่มการสนับสนุนอัตราการ FileDictionary (แนะนำ) และทำให้มันมากขึ้นที่กำหนด.
  • เพิ่ม BlendedInfixSuggester ใหม่ซึ่งเป็นเหมือน AnalyzingInfixSuggester แต่ช่วยเพิ่มคำแนะนำที่ตรงกับสัญญาณที่มีตำแหน่งต่ำกว่า.
  • เพิ่ม SimpleQueryParser. parser สำหรับการค้นหาของมนุษย์เข้ามา
  • เพิ่ม multitermquery (สัญลักษณ์คำนำหน้า, ฯลฯ ) เพื่อ PostingsHighlighter.

มีอะไรใหม่ ในรุ่น 4.6.0:

  • เพิ่มการสนับสนุนสำหรับการปรับปรุง NumericDocValues​​ สาขา (ไม่รวมอีกครั้ง ดัชนีเอกสาร) ผ่าน IndexWriter.updateNumericDocValue (ระยะสตริงยาว).
  • ใหม่ FreeTextSuggester สามารถคาดการณ์คำถัดไปโดยใช้แบบจำลอง ngram ภาษาที่เรียบง่ายที่มีประโยชน์สำหรับ & quot; หางยาว & quot; ข้อเสนอแนะ.
  • โมดูลการแสดงออกใหม่ช่วยให้การปรับแต่งการจัดอันดับที่มีไวยากรณ์สคริปต์เหมือน.
  • DirectDocValues​​Format ใหม่ที่สามารถถือทั้งค่าเอกสารในกองเป็นอาร์เรย์พื้นเมืองจาวาไม่มีการบีบอัด.
  • Term.hasFreqs ขณะนี้สามารถระบุได้ว่าสนามที่ได้รับการจัดทำดัชนีต่อ doc
  • ความถี่ระยะ.

มีอะไรใหม่ ในรุ่น 4.5.0:

  • ใหม่ในหน่วยความจำการใช้งาน DocIdSet ที่ดีขึ้นโดยเฉพาะอย่างยิ่ง กว่า FixedBitSet ชุดเล็ก:. WAH8DocIdSet, PFORDeltaDocIdSet และ EliasFanoDocIdSet
  • CachingWrapperFilter ตอนนี้มีตัวกรองแคช WAH8DocIdSet โดยค่าเริ่มต้นที่มีการใช้หน่วยความจำเช่นเดียวกับ FixedBitSet ในกรณีที่เลวร้ายที่สุด แต่มีขนาดเล็กและเร็วขึ้นในชุดขนาดเล็ก.
  • TokenStreams ชุดนี้เพิ่มตำแหน่งในที่สุด () เพื่อให้เราสามารถจัดการกับหลุมต่อท้าย.
  • IndexWriter ไม่โคลนที่กำหนด IndexWriterConfig.
  • bugfixes ต่าง ๆ และการเพิ่มประสิทธิภาพตั้งแต่การเปิดตัว 4.4.

มีอะไรใหม่ ในรุ่น 4.4.0:

  • โมดูลใหม่ซ้ำ: ทำซ้ำแก้ไขดัชนีระหว่างเซิร์ฟเวอร์และ ลูกค้า.
  • ใหม่ AnalyzingInfixSuggester. พบว่าข้อเสนอแนะในการแข่งขันตามที่จะสัญญาณใด ๆ ในข้อเสนอแนะที่ไม่ได้ขึ้นอยู่เพียงแค่ในการจับคู่คำนำหน้าบริสุทธิ์
  • ใหม่ PatternCaptureGroupTokenFilter. ปล่อยสัญญาณหลายอย่างใดอย่างหนึ่งสำหรับแต่ละกลุ่มจับภาพในหนึ่งหรือมากกว่า regexes Java
  • โมดูลใหม่ Lucene Facet.

มีอะไรใหม่ ในรุ่น 4.3.0:

  • ใหม่ SearcherTaxonomyManager จัดการใกล้เวลาจริงกลับมาคึกคักของ ทั้ง IndexSearcher และ TaxonomyReader (สำหรับ faceting).
  • วิธีการเพิ่มแง่มุมใหม่ที่จะโมดูลด้านการคำนวณด้านนับ SortedSetDocValues​​Field ใช้โดยไม่ต้องดัชนีอนุกรมวิธานแยกต่างหาก.
  • การปรับปรุงประสิทธิภาพอย่างมีนัยสำคัญสำหรับ minShouldMatch BooleanQuery เนื่องจากการกระโดดข้ามส่งผลให้ได้ถึง 4000% คำสั่งได้เร็วขึ้น.
  • bugfixes ต่าง ๆ และการเพิ่มประสิทธิภาพตั้งแต่การเปิดตัว 4.2.1.

มีอะไรใหม่ ในรุ่น 4.1.0:

  • Lucene ไม่พยายามที่เมื่อเขียนไฟล์ (ทุกสาขา ถูกเขียนในทางที่ผนวกเท่านั้น) ซึ่งหมายความว่ามันทำงานโดยเริ่มต้นด้วยการผนวกเท่านั้นลำธาร HDFS ฯลฯ ..
  • ใหม่แนะนำการใช้งาน: AnalyzingSuggester ที่รูปแบบพื้นฐาน (คำนวณจาก lucene วิเคราะห์) ใช้สำหรับข้อเสนอแนะที่จะแยกจากข้อความกลับและ FuzzySuggester ซึ่งนอกจากจะช่วยให้สำหรับการจับคู่ไม่แน่นอนในการป้อนข้อมูล
  • .
  • การสนับสนุนใกล้เรียลไทม์ถูกบันทึกอยู่ในโมดูลด้านได้.
  • ใหม่เน้น (postingshighlighter) เพิ่มโมดูลเน้นได้.
  • เพิ่ม FilterStrategy FilteredQuery เพื่อให้มีความยืดหยุ่นมากขึ้นในการดำเนินการแบบสอบถามกรอง.
  • เพิ่ม CommonTermsQuery เพื่อเพิ่มความเร็วในคำสั่งที่มีเงื่อนไขบ่อยอย่างมาก ความถี่ระยะที่ตรวจพบได้อย่างมีประสิทธิภาพในเวลาแบบสอบถาม -. การจัดทำดัชนีเวลาไม่จำเป็นต้องใช้
  • bugfixes หลายและการเพิ่มประสิทธิภาพตั้งแต่รุ่น 4.0.

มีอะไรใหม่ ในรุ่น 4.0 อัลฟา:

  • รูปแบบดัชนีสำหรับคำที่รายการโพสต์ที่เก็บไว้ ทุ่งคำ
  • เวกเตอร์ ฯลฯ pluggable ผ่าน Codec API คุณสามารถเลือกจากการใช้งานที่ให้มาหรือปรับแต่งรูปแบบดัชนีที่มีตัวแปลงสัญญาณของคุณเองเพื่อตอบสนองความต้องการของคุณ.
  • ผลการดำเนินงานอย่างมีนัยสำคัญได้เร็วขึ้นเมื่อใช้ตัวกรองในระหว่างการค้นหา.
  • ไฟล์ระบบไดเรกทอรีที่ใช้สามารถประเมิน-IO จำกัด (MB / วินาที) หัวข้อผสานเพื่อลดความขัดแย้งระหว่าง IO การควบรวมกิจการและการค้นหาหัวข้อ.
  • FuzzyQuery เป็น 100-200 ครั้งเร็วกว่าในรุ่นที่ผ่านมา.
  • ตรวจสอบการสะกดใหม่ DirectSpellChecker พบว่าการแก้ไขที่เป็นไปได้
  • โดยตรงกับดัชนีการค้นหาหลักโดยไม่ต้องมีดัชนีที่แยกต่างหาก.

มีอะไรใหม่ ในรุ่น 3.6.0:

  • นอกจาก Java 5 และ Java 6 นี้ การเปิดตัวเต็มรูปแบบได้ในขณะนี้การสนับสนุน Java 7 (ขั้นต่ำ 7u1 JDK จำเป็น).
  • TypeTokenFilter กรองสัญญาณขึ้นอยู่กับ TypeAttribute ของพวกเขา.
  • ข้อบกพร่องคงชดเชยในจำนวนของ CharFilters, Tokenizers และ TokenFilters ที่อาจนำไปสู่​​ข้อยกเว้นในช่วงไฮไลท์.
  • เพิ่มเข้ารหัสการออกเสียง: Metaphone, Soundex, Caverphone, Beider-มอร์ส ฯลฯ
  • .
  • CJKBigramFilter และ CJKWidthFilter แทนที่ CJKTokenizer.
  • Kuromoji วิเคราะห์ลักษณะทางสัณฐานวิทยา tokenizes ข้อความภาษาญี่ปุ่น, การผลิตทั้งคำประสมและการแบ่งส่วนของพวกเขา.
  • การตัดแต่งกิ่งดัชนีแบบคงที่ (คาร์เมลตัดแต่งกิ่ง) ลบโพสต์ที่มีระดับต่ำภายในเอกสารความถี่ระยะ.
  • QueryParser ตอนนี้ตีความ '*' เป็นปลายเปิดสำหรับการค้นหาช่วง.
  • FieldValueFilter ไม่รวมเอกสารหายไปสาขาที่ระบุ.
  • CheckIndex IndexUpgrader และช่วยให้คุณสามารถระบุการดำเนิน FSDirectory ที่เฉพาะเจาะจงที่จะใช้กับใหม่ -dir-Impl ตัวเลือกบรรทัดคำสั่ง.
  • FSTs ตอนนี้สามารถทำค้นหาแบบย้อนกลับ (โดยการส่งออก) ในบางกรณีและสามารถบรรจุเพื่อลดขนาดของพวกเขา ตอนนี้จะมีวิธีการที่จะดึงบน N เส้นทางที่สั้นที่สุดจากโหนดเริ่มต้นใน FST.
  • ใหม่ WFSTCompletionLookup Suggester สนับสนุนการจัดอันดับที่ดีกว่าเม็ดเล็กสำหรับข้อเสนอแนะ.
  • FST ตาม suggesters ตอนนี้ใช้แบบออฟไลน์ (ดิสก์) เรียงลำดับแทนของการจัดเรียงในหน่วยความจำเมื่อก่อนการเรียงลำดับคำแนะนำ.
  • ToChildBlockJoinQuery ร่​​วมในทิศทางตรงกันข้าม (แม่ลงไปที่เด็กเอกสาร).
  • แบบสอบถามเวลาใหม่มาร่วมงานมีความยืดหยุ่นมากขึ้น (แต่น้อย performant กว่า) ดัชนีเวลาร่วม.
  • เพิ่ม HTMLStripCharFilter ที่จะตัดมาร์กอัป HTML.

มีอะไรใหม่ ในรุ่น 3.5.0:

  • เพิ่มที่สำคัญมาก (3-5X) RAM ลดต้องถือดัชนีเงื่อนไขเกี่ยวกับการเปิด IndexReader.
  • เพิ่ม IndexSearcher.searchAfter ซึ่งผลลัพธ์หลังจาก ScoreDoc ระบุ (เช่นเอกสารล่าสุดเมื่อวันที่หน้าก่อนหน้า) เพื่อสนับสนุนเพจกรณีการใช้งานลึก.
  • เพิ่ม SearcherManager การจัดการร่วมกันและเปิด IndexSearchers ทั่วหัวข้อค้นหาหลาย กรณี IndexReader อ้างอิงจะปิดได้อย่างปลอดภัยหากไม่ได้อ้างอิงอีกต่อไป.
  • เพิ่ม SearcherLifetimeManager ที่ปลอดภัยให้มุมมองที่สอดคล้องกันของดัชนีระหว่างการร้องขอหลาย ๆ (เช่นเพจ / เจาะลึก).
  • เปลี่ยนชื่อ IndexWriter.optimize forceMerge เพื่อที่จะกีดกันการใช้วิธีนี้เพราะมันจะเป็นค่าใช้จ่ายอย่างน่ากลัวและไม่ค่อยเป็นธรรมอีกต่อไป.

มีอะไรใหม่ ในรุ่น 3.3.0:

  • โมดูลเช็คคำสะกดขณะนี้รวมถึงแนะนำ / อัตโนมัติสมบูรณ์ ฟังก์ชั่นการใช้งานที่มีสาม:. Jaspell, Ternary Trie และรัฐ จำกัด
  • การสนับสนุนสำหรับการรวมผลที่ได้จากเศษหลายทั้ง & quot; ปกติ & quot; ผลการค้นหา (TopDocs.merge) เช่นเดียวกับผลการจัดกลุ่มโดยใช้โมดูลการจัดกลุ่ม (SearchGroup.merge, TopGroups.merge).
  • การดำเนินการเพิ่มประสิทธิภาพของ KStem เป็น Stemmer ก้าวร้าวน้อยสำหรับภาษาอังกฤษ.
  • การจัดกลุ่มเดียวผ่านการดำเนินการจัดทำดัชนีขึ้นอยู่กับบล็อกเอกสาร.
  • การปรับปรุง MMapDirectory (ตอนนี้ยังใช้งานเริ่มต้นที่ส่งกลับโดย FSDirectory.open บน Linux 64 บิต).
  • NRTManager ช่วยลดความยุ่งยากในการจัดการใกล้เวลาจริงการค้นหาที่มีหัวข้อการค้นหาหลายที่ช่วยให้การประยุกต์ใช้ในการควบคุมการเปลี่ยนแปลงการจัดทำดัชนีจะต้องมองเห็นที่คำขอการค้นหา.
  • TwoPhaseCommitTool อำนวยความสะดวกในการดำเนินการเป็นทรัพยากรที่หลายสองค่อย ๆ กระทำรวมทั้ง IndexWriter.
  • นโยบายผสานค่าเริ่มต้น TieredMergePolicy มีวิธีการใหม่ (ชุด / getReclaimDeletesWeight) เพื่อควบคุมวิธีการเชิงรุกกลุ่มเป้าหมายที่มีการลบและเป็นเชิงรุกมากขึ้นกว่า แต่ก่อนโดยค่าเริ่มต้น.
  • เครื่องมือ PKIndexSplitter แยกดัชนีโดยระยะกลางจุด.

มีอะไรใหม่ ในรุ่น 3.2.0:

  • โมดูลการจัดกลุ่มใหม่ภายใต้ lucene / contrib / การจัดกลุ่มจะช่วยให้ผลการค้นหาจะถูกจัดกลุ่มเป็นหนึ่งเดียวที่มีมูลค่าการจัดทำดัชนีสนาม.
  • เครื่องมือ IndexUpgrader ใหม่อย่างเต็มที่แปลงดัชนีเก่าไปยังรูปแบบปัจจุบัน.
  • การดำเนินไดเรกทอรีใหม่ NRTCachingDirectory, แคชส่วนเล็ก ๆ ในหน่วยความจำเพื่อลด I / O โหลดสำหรับการใช้งานได้อย่างรวดเร็วด้วยการเปิดอัตรา NRT.
  • การดำเนินงานสะสมใหม่ CachingCollector คือสามารถที่จะรวบรวมเพลงฮิตค้นหา (รหัสเอกสารและเลือกที่จะยังคะแนน) และจากนั้นพวกเขาเล่น นี้จะเป็นประโยชน์สำหรับนักสะสมที่ต้องใช้สองคนหรือมากกว่าที่ผ่านมาจะให้ผลลัพธ์ที่.
  • ดัชนีบล็อกเอกสารโดยใช้ IndexWriter ของ addDocuments ใหม่หรือวิธีการ updateDocuments เหล่านี้ API สำหรับการทดลองให้แน่ใจว่าบล็อกของเอกสารตลอดไปจะยังคงอยู่ต่อเนื่องกันในดัชนีที่ช่วยให้อนาคตที่น่าสนใจเช่นการจัดกลุ่มมีและร่วม.
  • นโยบายผสานเริ่มต้นใหม่ TieredMergePolicy ซึ่งมีประสิทธิภาพมากขึ้นเนื่องจากความสามารถในการรวมกลุ่มที่ไม่อยู่ติดกัน.
  • NumericField จะถูกส่งกลับในขณะนี้ได้อย่างถูกต้องเมื่อคุณโหลดเอกสารที่เก็บไว้ (ก่อนหน้านี้คุณได้รับสนามปกติกลับมีค่าตัวเลขสตริงแปลง).

มีอะไรใหม่ ในรุ่น 3.1.0:.

  • ConstantScoreQuery ในขณะนี้ช่วยให้การตัดโดยตรงแบบสอบถาม
  • IndexWriter มีการกำหนดค่าในขณะนี้กับผู้สร้างแยกต่างหาก API ใหม่, IndexWriterConfig ตอนนี้คุณสามารถควบคุมวงเงินกระทู้ภายใน IndexWriter คงก่อนหน้านี้โดยการเรียก setMaxThreadStates.
  • IndexWriter.getReader จะถูกแทนที่ด้วย IndexReader.open (IndexWriter) นอกจากนี้คุณสามารถระบุได้ว่าลบควรจะแก้ไขเมื่อคุณเปิดอ่าน NRT.
  • MultiSearcher จะเลิก; ParallelMultiSearcher ได้รับการดูดซึมโดยตรงใน IndexSearcher.
  • ใน 64bit Windows และ Solaris JVMs, MMapDirectory อยู่ในขณะนี้การดำเนินงานเริ่มต้น (ส่งกลับโดย FSDirectory.open) MMapDirectory ยังช่วยให้ unmapping ถ้า JVM ที่สนับสนุน.
  • ใหม่ TotalHitCountCollector เพียงแค่นับจำนวนของการเข้าชม.
  • ReaderFinishedListener API ช่วยให้แคชภายนอกที่จะขับไล่รายการครั้งหนึ่งเคยเป็นส่วนที่จะเสร็จสิ้น.

มีอะไรใหม่ ในรุ่น 3.0.1:.

  • ลบที่ไม่จำเป็นในการประสาน FuzzyTermEnum
  • เมื่อการแก้ไขแง่ลบทำในลำดับการจัดเรียงยาวสำหรับประสิทธิภาพที่ดีขึ้น.
  • อย่าให้ถูกต้องคำเตือนเกี่ยวกับระยะเดียวกันอันยิ่งใหญ่เมื่อ IndexWriter.infoStream อยู่บน.
  • แก้ไข Min / MaxPayloadFunction กลับ 0 เมื่อเพียงหนึ่งบรรจุเป็นปัจจุบัน.
  • แบบสอบถามประกอบด้วยทุกคำสั่งศูนย์เพิ่ม (ตัวอย่างเช่นข้อความ: foo ^ 0) เรียงไม่ถูกต้องและไม่ถูกต้องผลิต docids
  • .
  • ถอด ScoreTerm ระดับชั้นป้องกันจาก FuzzyQuery การเปลี่ยนแปลงเป็นสิ่งที่จำเป็นเพราะเปรียบเทียบของชั้นนี้ได้มีการเปลี่ยนแปลงในทางที่เข้ากันไม่ได้ ชั้นก็ไม่เคยตั้งใจจะให้ประชาชน.

สิ่งที่ใหม่ ในรุ่น 2.9.2:

  • BooleanQuery ถูกละเลย disableCoord ใน hashCode และเท่ากับวิธีการ ก่อให้เกิดสิ่งที่ไม่ดีที่จะเกิดขึ้นเมื่อแคช BooleanQueries.
  • อย่าให้ถูกต้องคำเตือนเกี่ยวกับระยะเดียวกันอันยิ่งใหญ่เมื่อ IndexWriter.infoStream อยู่บน.
  • การจัดทำดัชนีในอัตราสูงอ่าน NRT ชั่วคราวอาจสูญเสียการลบ.

มีอะไรใหม่ ในรุ่น 3.0.0:

  • ลบสถานที่ให้บริการระบบการตั้งค่าการใช้งานระดับ SegmentReader
  • เปลี่ยนประเภทการกลับมาของภาพรวม SnapshotDeletionPolicy # () จาก IndexCommitPoint เพื่อ IndexCommit รหัสที่ใช้วิธีการนี​​้จะต้อง recompiled กับ Lucene 3.0 เพื่อที่จะทำงาน เลิกก่อนหน้านี้จะถูกลบออก IndexCommitPoint ยัง.
  • ให้ AttributeFactory ที่สร้างความสะดวกสบายเช่น Token สำหรับคุณลักษณะพื้นฐานทั้งหมด.
  • ลบเรียกซ้ำใน NumericRangeTermEnum.
  • เพิ่มประสิทธิภาพการคำนวณระยะทาง Levenshtein ใน FuzzyQuery.

ซอฟต์แวร์ที่คล้ายกัน

Lunr.js
Lunr.js

10 Apr 16

jQuery Looking For
jQuery Looking For

12 Apr 15

Apache Blur
Apache Blur

13 Apr 15

ซอฟแวร์อื่น ๆ ของนักพัฒนา Apache Software Foundation

Apache Ambari
Apache Ambari

11 Mar 16

Apache Ant
Apache Ant

11 Aug 16

Apache Etch
Apache Etch

13 Apr 15

ความคิดเห็นที่ Apache Lucene

ความคิดเห็นที่ไม่พบ
เพิ่มความคิดเห็น
เปิดภาพ!
ค้นหาตามหมวดหมู่