Apache Lucene เหมาะสำหรับการใช้งานที่ต้องการการสนับสนุนเพื่อการค้นหาข้อความแบบเต็มใด ๆ ในขณะที่ยังทำให้การใช้ทรัพยากรเซิร์ฟเวอร์ลงและผลิตผลลัพธ์ที่รวดเร็วและความแม่นยำสูง.
Lucene เป็นที่ยอมรับอย่างกว้างขวางว่าเป็นหนึ่งในเครื่องมือค้นหาที่ดีที่สุดรอบเป็นที่หลักของเครื่องมือค้นหาอื่น ๆ อีกมากมายที่เป็นที่มีชื่อเสียงที่สุด Apache Solr .
Lucene เขียนทั้งหมดในเกาะชวาและตั้งแต่ได้รับการปล่อยตัวโดยมูลนิธิอาปาเช่จะได้รับการแจ้งความกับภาษาอื่น ๆ อีกมากมายและการผูกต่างๆและห่ออยู่ในฐานะของบุคคลที่สามการพัฒนาซอฟแวร์.
มีอะไรใหม่ ในข่าวประชาสัมพันธ์ฉบับนี้
- การเข้าถึงไฟล์ทั้งหมดตอนนี้ใช้ APIs ของ Java NIO.2 ที่ให้ Lucene ดัชนีความปลอดภัยที่แข็งแกร่งในแง่ของการจัดการข้อผิดพลาดที่ดีขึ้นและ กระทำที่ปลอดภัย.
- ทุกส่วน Lucene ตอนนี้เก็บ ID ไม่ซ้ำกันต่อส่วนต่อและมุ่งมั่นที่จะช่วยในการจำลองแบบที่ถูกต้องของไฟล์ดัชนี.
- ในระหว่างการรวม IndexWriter ตอนนี้จะตรวจสอบกลุ่มที่เข้ามาสำหรับความเสียหายก่อนจะรวม นี้อาจหมายถึงในการอัพเกรดเป็น 5.0.0 ผสานที่อาจค้นพบการทุจริตแฝงยาวนานในดัชนี 4.x เก่า.
มีอะไรใหม่ ในรุ่น 5.2.1 / 4.10.4 / 3.6.2:
- ไฟล์ทั้งหมด ตอนนี้ใช้การเข้าถึง APIs ของ Java NIO.2 ที่ให้ Lucene ดัชนีความปลอดภัยที่แข็งแกร่งในแง่ของการจัดการข้อผิดพลาดที่ดีขึ้นและปลอดภัยมากขึ้นกระทำ.
- ทุกส่วน Lucene ตอนนี้เก็บ ID ไม่ซ้ำกันต่อส่วนต่อและมุ่งมั่นที่จะช่วยในการจำลองแบบที่ถูกต้องของไฟล์ดัชนี.
- ในระหว่างการรวม IndexWriter ตอนนี้จะตรวจสอบกลุ่มที่เข้ามาสำหรับความเสียหายก่อนจะรวม นี้อาจหมายถึงในการอัพเกรดเป็น 5.0.0 ผสานที่อาจค้นพบการทุจริตแฝงยาวนานในดัชนี 4.x เก่า.
มีอะไรใหม่ ในรุ่น 5.1.0 / 4.10.4 / 3.6.2:
- ไฟล์ทั้งหมด ตอนนี้ใช้การเข้าถึง APIs ของ Java NIO.2 ที่ให้ Lucene ดัชนีความปลอดภัยที่แข็งแกร่งในแง่ของการจัดการข้อผิดพลาดที่ดีขึ้นและปลอดภัยมากขึ้นกระทำ.
- ทุกส่วน Lucene ตอนนี้เก็บ ID ไม่ซ้ำกันต่อส่วนต่อและมุ่งมั่นที่จะช่วยในการจำลองแบบที่ถูกต้องของไฟล์ดัชนี.
- ในระหว่างการรวม IndexWriter ตอนนี้จะตรวจสอบกลุ่มที่เข้ามาสำหรับความเสียหายก่อนจะรวม นี้อาจหมายถึงในการอัพเกรดเป็น 5.0.0 ผสานที่อาจค้นพบการทุจริตแฝงยาวนานในดัชนี 4.x เก่า.
มีอะไรใหม่ ในรุ่น 5.0.0 / 4.10.3 / 3.6.2:
- ข้อตกลงใหม่ .getMin / แม็กซ์วิธีการที่จะดึงข้อตกลงต่ำสุดและสูงสุดต่อสนาม.
- ใหม่ IDVersionPostingsFormat เหมาะสำหรับการค้นหา ID ที่เชื่อมโยงรุ่น monotonically เพิ่มขึ้นต่อ ID.
- ปรับปรุงอะตอมของชุดของเอกสารค่าสาขา.
- การเพิ่มประสิทธิภาพมากมายสำหรับ doc ค่าประสิทธิภาพเวลาค้นหา.
- ใหม่ (เริ่มต้น) Lucene49NormsFormat ที่ดีกว่าการบีบอัดบางกรณีเช่นสาขาที่สั้นมาก.
- ประเภทใหม่ SORTED_NUMERIC docvalues สำหรับการประมวลผลที่มีประสิทธิภาพของเขตข้อมูลที่เป็นตัวเลขหลายค่า.
- ดัชนีผ่านกระแสโทเค็นก่อนหน้านี้สำหรับนำมาใช้ใหม่ได้ง่ายขึ้น.
- MoreLikeThis ยอมรับค่าหลายต่อสนาม.
- ทุกชั้นเรียนที่ประเมินการใช้ RAM ของพวกเขาในขณะนี้ใช้อินเตอร์เฟซที่รับผิดชอบใหม่.
- ไฟล์ Lucene ถูกเขียนโดยขณะนี้ (File) OutputStream บนแพลตฟอร์มทั้งหมดสมบูรณ์ไม่อนุญาตให้มีการแสวงหา APIs IO ง่าย.
- การปรับปรุงข้อผิดพลาดสับสนเมื่อ MMapDirectory ไม่สามารถสร้างแผนที่ใหม่.
มีอะไรใหม่ ในรุ่น 4.8.0:
- Lucene มีใหม่ Rescorer / QueryRescorer API ที่จะดำเนินการ rescoring สองผ่านหรือ reranking ของผลการค้นหาโดยใช้ฟังก์ชั่นการให้คะแนนที่มีราคาแพงมากขึ้นหลังจากครั้งแรกผ่านคอลเลกชัน.
- AnalyzingInfixSuggester ขณะนี้สนับสนุนใกล้เวลาจริง autosuggest.
- ประยุกต์การโพสต์ผลกระทบเรียง (ใช้ SortingMergePolicy และ EarlyTerminatingCollector) เพื่อใช้จัดเรียงชั้น Lucene เพื่อแสดงลำดับการจัดเรียง.
- การให้คะแนนเป็นกลุ่มปกติและเกณฑ์การให้คะแนนตาม iterator ถูกแยกออกเพื่อให้คำสั่งบางอย่างสามารถทำคะแนนจำนวนมากได้อย่างมีประสิทธิภาพ.
- เปลี่ยนไป MurmurHash3 จะสับเงื่อนไขในระหว่างการจัดทำดัชนี.
- IndexWriter ในขณะนี้สนับสนุนการปรับปรุงฟิลด์ค่า doc ไบนารี.
- HunspellStemFilter ตอนนี้ใช้ 10 ถึง 100x RAM น้อย นอกจากนี้ยังเป็นที่รู้จักกันทั้งหมดโหลดพจนานุกรม OpenOffice ไม่มีข้อผิดพลาด.
- Lucene ตอนนี้ยัง fsyncs เมตาดาต้าไดเรกทอรีบนกระทำถ้าระบบปฏิบัติการและระบบไฟล์อนุญาต (Linux, MacOSX เป็นที่รู้จักกันในการทำงาน).
- Lucene ตอนนี้ใช้ฟังก์ชั่นระบบไฟล์ Java 7 ภายใต้ประทุนดังนั้นไฟล์ดัชนีสามารถลบได้บน Windows, แม้ในขณะที่ผู้อ่านยังคงเปิด.
- ข้อผิดพลาดร้ายแรงใน NativeFSLockFactory ถูกแก้ไขซึ่งอาจทำให้หลาย IndexWriters ที่จะได้รับล็อคเดียวกัน ล็อคไฟล์จะถูกลบออกไม่ได้จากไดเรกทอรีดัชนีแม้ในขณะที่ล็อคไม่ได้ถูกจัดขึ้น.
มีอะไรใหม่ ในรุ่น 4.7.0:
- เมื่อเรียงลำดับตามสตริง (SortField.STRING) ตอนนี้คุณสามารถระบุได้ว่าค่าที่ขาดหายไปควรจะเรียงแรก (เริ่มต้น) หรือที่ผ่านมา.
- NRT สนับสนุนสำหรับระบบไฟล์ที่ไม่ได้ลบในใกล้ที่ผ่านมาหรือไม่สามารถลบในขณะที่ความหมายอ้างอิง.
- เพิ่ม LongBitSet สำหรับการจัดการมากกว่า 2.1B บิต (มิฉะนั้นใช้ FixedBitSet).
- เพิ่มวิเคราะห์สำหรับดิช.
- เพิ่มการสนับสนุนอัตราการ FileDictionary (แนะนำ) และทำให้มันมากขึ้นที่กำหนด.
- เพิ่ม BlendedInfixSuggester ใหม่ซึ่งเป็นเหมือน AnalyzingInfixSuggester แต่ช่วยเพิ่มคำแนะนำที่ตรงกับสัญญาณที่มีตำแหน่งต่ำกว่า.
- เพิ่ม SimpleQueryParser. parser สำหรับการค้นหาของมนุษย์เข้ามา
- เพิ่ม multitermquery (สัญลักษณ์คำนำหน้า, ฯลฯ ) เพื่อ PostingsHighlighter.
มีอะไรใหม่ ในรุ่น 4.6.0:
- เพิ่มการสนับสนุนสำหรับการปรับปรุง NumericDocValues สาขา (ไม่รวมอีกครั้ง ดัชนีเอกสาร) ผ่าน IndexWriter.updateNumericDocValue (ระยะสตริงยาว).
- ใหม่ FreeTextSuggester สามารถคาดการณ์คำถัดไปโดยใช้แบบจำลอง ngram ภาษาที่เรียบง่ายที่มีประโยชน์สำหรับ & quot; หางยาว & quot; ข้อเสนอแนะ.
- โมดูลการแสดงออกใหม่ช่วยให้การปรับแต่งการจัดอันดับที่มีไวยากรณ์สคริปต์เหมือน.
- DirectDocValuesFormat ใหม่ที่สามารถถือทั้งค่าเอกสารในกองเป็นอาร์เรย์พื้นเมืองจาวาไม่มีการบีบอัด.
- Term.hasFreqs ขณะนี้สามารถระบุได้ว่าสนามที่ได้รับการจัดทำดัชนีต่อ doc
- ความถี่ระยะ.
มีอะไรใหม่ ในรุ่น 4.5.0:
- ใหม่ในหน่วยความจำการใช้งาน DocIdSet ที่ดีขึ้นโดยเฉพาะอย่างยิ่ง กว่า FixedBitSet ชุดเล็ก:. WAH8DocIdSet, PFORDeltaDocIdSet และ EliasFanoDocIdSet
- CachingWrapperFilter ตอนนี้มีตัวกรองแคช WAH8DocIdSet โดยค่าเริ่มต้นที่มีการใช้หน่วยความจำเช่นเดียวกับ FixedBitSet ในกรณีที่เลวร้ายที่สุด แต่มีขนาดเล็กและเร็วขึ้นในชุดขนาดเล็ก.
- TokenStreams ชุดนี้เพิ่มตำแหน่งในที่สุด () เพื่อให้เราสามารถจัดการกับหลุมต่อท้าย.
- IndexWriter ไม่โคลนที่กำหนด IndexWriterConfig.
- bugfixes ต่าง ๆ และการเพิ่มประสิทธิภาพตั้งแต่การเปิดตัว 4.4.
มีอะไรใหม่ ในรุ่น 4.4.0:
- โมดูลใหม่ซ้ำ: ทำซ้ำแก้ไขดัชนีระหว่างเซิร์ฟเวอร์และ ลูกค้า.
- ใหม่ AnalyzingInfixSuggester. พบว่าข้อเสนอแนะในการแข่งขันตามที่จะสัญญาณใด ๆ ในข้อเสนอแนะที่ไม่ได้ขึ้นอยู่เพียงแค่ในการจับคู่คำนำหน้าบริสุทธิ์
- ใหม่ PatternCaptureGroupTokenFilter. ปล่อยสัญญาณหลายอย่างใดอย่างหนึ่งสำหรับแต่ละกลุ่มจับภาพในหนึ่งหรือมากกว่า regexes Java
- โมดูลใหม่ Lucene Facet.
มีอะไรใหม่ ในรุ่น 4.3.0:
- ใหม่ SearcherTaxonomyManager จัดการใกล้เวลาจริงกลับมาคึกคักของ ทั้ง IndexSearcher และ TaxonomyReader (สำหรับ faceting).
- วิธีการเพิ่มแง่มุมใหม่ที่จะโมดูลด้านการคำนวณด้านนับ SortedSetDocValuesField ใช้โดยไม่ต้องดัชนีอนุกรมวิธานแยกต่างหาก.
- การปรับปรุงประสิทธิภาพอย่างมีนัยสำคัญสำหรับ minShouldMatch BooleanQuery เนื่องจากการกระโดดข้ามส่งผลให้ได้ถึง 4000% คำสั่งได้เร็วขึ้น.
- bugfixes ต่าง ๆ และการเพิ่มประสิทธิภาพตั้งแต่การเปิดตัว 4.2.1.
มีอะไรใหม่ ในรุ่น 4.1.0:
- Lucene ไม่พยายามที่เมื่อเขียนไฟล์ (ทุกสาขา ถูกเขียนในทางที่ผนวกเท่านั้น) ซึ่งหมายความว่ามันทำงานโดยเริ่มต้นด้วยการผนวกเท่านั้นลำธาร HDFS ฯลฯ ..
- ใหม่แนะนำการใช้งาน: AnalyzingSuggester ที่รูปแบบพื้นฐาน (คำนวณจาก lucene วิเคราะห์) ใช้สำหรับข้อเสนอแนะที่จะแยกจากข้อความกลับและ FuzzySuggester ซึ่งนอกจากจะช่วยให้สำหรับการจับคู่ไม่แน่นอนในการป้อนข้อมูล .
- การสนับสนุนใกล้เรียลไทม์ถูกบันทึกอยู่ในโมดูลด้านได้.
- ใหม่เน้น (postingshighlighter) เพิ่มโมดูลเน้นได้.
- เพิ่ม FilterStrategy FilteredQuery เพื่อให้มีความยืดหยุ่นมากขึ้นในการดำเนินการแบบสอบถามกรอง.
- เพิ่ม CommonTermsQuery เพื่อเพิ่มความเร็วในคำสั่งที่มีเงื่อนไขบ่อยอย่างมาก ความถี่ระยะที่ตรวจพบได้อย่างมีประสิทธิภาพในเวลาแบบสอบถาม -. การจัดทำดัชนีเวลาไม่จำเป็นต้องใช้
- bugfixes หลายและการเพิ่มประสิทธิภาพตั้งแต่รุ่น 4.0.
มีอะไรใหม่ ในรุ่น 4.0 อัลฟา:
- รูปแบบดัชนีสำหรับคำที่รายการโพสต์ที่เก็บไว้ ทุ่งคำ
- เวกเตอร์ ฯลฯ pluggable ผ่าน Codec API คุณสามารถเลือกจากการใช้งานที่ให้มาหรือปรับแต่งรูปแบบดัชนีที่มีตัวแปลงสัญญาณของคุณเองเพื่อตอบสนองความต้องการของคุณ.
- ผลการดำเนินงานอย่างมีนัยสำคัญได้เร็วขึ้นเมื่อใช้ตัวกรองในระหว่างการค้นหา.
- ไฟล์ระบบไดเรกทอรีที่ใช้สามารถประเมิน-IO จำกัด (MB / วินาที) หัวข้อผสานเพื่อลดความขัดแย้งระหว่าง IO การควบรวมกิจการและการค้นหาหัวข้อ.
- FuzzyQuery เป็น 100-200 ครั้งเร็วกว่าในรุ่นที่ผ่านมา.
- ตรวจสอบการสะกดใหม่ DirectSpellChecker พบว่าการแก้ไขที่เป็นไปได้
- โดยตรงกับดัชนีการค้นหาหลักโดยไม่ต้องมีดัชนีที่แยกต่างหาก.
มีอะไรใหม่ ในรุ่น 3.6.0:
- นอกจาก Java 5 และ Java 6 นี้ การเปิดตัวเต็มรูปแบบได้ในขณะนี้การสนับสนุน Java 7 (ขั้นต่ำ 7u1 JDK จำเป็น).
- TypeTokenFilter กรองสัญญาณขึ้นอยู่กับ TypeAttribute ของพวกเขา.
- ข้อบกพร่องคงชดเชยในจำนวนของ CharFilters, Tokenizers และ TokenFilters ที่อาจนำไปสู่ข้อยกเว้นในช่วงไฮไลท์.
- เพิ่มเข้ารหัสการออกเสียง: Metaphone, Soundex, Caverphone, Beider-มอร์ส ฯลฯ .
- CJKBigramFilter และ CJKWidthFilter แทนที่ CJKTokenizer.
- Kuromoji วิเคราะห์ลักษณะทางสัณฐานวิทยา tokenizes ข้อความภาษาญี่ปุ่น, การผลิตทั้งคำประสมและการแบ่งส่วนของพวกเขา.
- การตัดแต่งกิ่งดัชนีแบบคงที่ (คาร์เมลตัดแต่งกิ่ง) ลบโพสต์ที่มีระดับต่ำภายในเอกสารความถี่ระยะ.
- QueryParser ตอนนี้ตีความ '*' เป็นปลายเปิดสำหรับการค้นหาช่วง.
- FieldValueFilter ไม่รวมเอกสารหายไปสาขาที่ระบุ.
- CheckIndex IndexUpgrader และช่วยให้คุณสามารถระบุการดำเนิน FSDirectory ที่เฉพาะเจาะจงที่จะใช้กับใหม่ -dir-Impl ตัวเลือกบรรทัดคำสั่ง.
- FSTs ตอนนี้สามารถทำค้นหาแบบย้อนกลับ (โดยการส่งออก) ในบางกรณีและสามารถบรรจุเพื่อลดขนาดของพวกเขา ตอนนี้จะมีวิธีการที่จะดึงบน N เส้นทางที่สั้นที่สุดจากโหนดเริ่มต้นใน FST.
- ใหม่ WFSTCompletionLookup Suggester สนับสนุนการจัดอันดับที่ดีกว่าเม็ดเล็กสำหรับข้อเสนอแนะ.
- FST ตาม suggesters ตอนนี้ใช้แบบออฟไลน์ (ดิสก์) เรียงลำดับแทนของการจัดเรียงในหน่วยความจำเมื่อก่อนการเรียงลำดับคำแนะนำ.
- ToChildBlockJoinQuery ร่วมในทิศทางตรงกันข้าม (แม่ลงไปที่เด็กเอกสาร).
- แบบสอบถามเวลาใหม่มาร่วมงานมีความยืดหยุ่นมากขึ้น (แต่น้อย performant กว่า) ดัชนีเวลาร่วม.
- เพิ่ม HTMLStripCharFilter ที่จะตัดมาร์กอัป HTML.
มีอะไรใหม่ ในรุ่น 3.5.0:
- เพิ่มที่สำคัญมาก (3-5X) RAM ลดต้องถือดัชนีเงื่อนไขเกี่ยวกับการเปิด IndexReader.
- เพิ่ม IndexSearcher.searchAfter ซึ่งผลลัพธ์หลังจาก ScoreDoc ระบุ (เช่นเอกสารล่าสุดเมื่อวันที่หน้าก่อนหน้า) เพื่อสนับสนุนเพจกรณีการใช้งานลึก.
- เพิ่ม SearcherManager การจัดการร่วมกันและเปิด IndexSearchers ทั่วหัวข้อค้นหาหลาย กรณี IndexReader อ้างอิงจะปิดได้อย่างปลอดภัยหากไม่ได้อ้างอิงอีกต่อไป.
- เพิ่ม SearcherLifetimeManager ที่ปลอดภัยให้มุมมองที่สอดคล้องกันของดัชนีระหว่างการร้องขอหลาย ๆ (เช่นเพจ / เจาะลึก).
- เปลี่ยนชื่อ IndexWriter.optimize forceMerge เพื่อที่จะกีดกันการใช้วิธีนี้เพราะมันจะเป็นค่าใช้จ่ายอย่างน่ากลัวและไม่ค่อยเป็นธรรมอีกต่อไป.
มีอะไรใหม่ ในรุ่น 3.3.0:
- โมดูลเช็คคำสะกดขณะนี้รวมถึงแนะนำ / อัตโนมัติสมบูรณ์ ฟังก์ชั่นการใช้งานที่มีสาม:. Jaspell, Ternary Trie และรัฐ จำกัด
- การสนับสนุนสำหรับการรวมผลที่ได้จากเศษหลายทั้ง & quot; ปกติ & quot; ผลการค้นหา (TopDocs.merge) เช่นเดียวกับผลการจัดกลุ่มโดยใช้โมดูลการจัดกลุ่ม (SearchGroup.merge, TopGroups.merge).
- การดำเนินการเพิ่มประสิทธิภาพของ KStem เป็น Stemmer ก้าวร้าวน้อยสำหรับภาษาอังกฤษ.
- การจัดกลุ่มเดียวผ่านการดำเนินการจัดทำดัชนีขึ้นอยู่กับบล็อกเอกสาร.
- การปรับปรุง MMapDirectory (ตอนนี้ยังใช้งานเริ่มต้นที่ส่งกลับโดย FSDirectory.open บน Linux 64 บิต).
- NRTManager ช่วยลดความยุ่งยากในการจัดการใกล้เวลาจริงการค้นหาที่มีหัวข้อการค้นหาหลายที่ช่วยให้การประยุกต์ใช้ในการควบคุมการเปลี่ยนแปลงการจัดทำดัชนีจะต้องมองเห็นที่คำขอการค้นหา.
- TwoPhaseCommitTool อำนวยความสะดวกในการดำเนินการเป็นทรัพยากรที่หลายสองค่อย ๆ กระทำรวมทั้ง IndexWriter.
- นโยบายผสานค่าเริ่มต้น TieredMergePolicy มีวิธีการใหม่ (ชุด / getReclaimDeletesWeight) เพื่อควบคุมวิธีการเชิงรุกกลุ่มเป้าหมายที่มีการลบและเป็นเชิงรุกมากขึ้นกว่า แต่ก่อนโดยค่าเริ่มต้น.
- เครื่องมือ PKIndexSplitter แยกดัชนีโดยระยะกลางจุด.
มีอะไรใหม่ ในรุ่น 3.2.0:
- โมดูลการจัดกลุ่มใหม่ภายใต้ lucene / contrib / การจัดกลุ่มจะช่วยให้ผลการค้นหาจะถูกจัดกลุ่มเป็นหนึ่งเดียวที่มีมูลค่าการจัดทำดัชนีสนาม.
- เครื่องมือ IndexUpgrader ใหม่อย่างเต็มที่แปลงดัชนีเก่าไปยังรูปแบบปัจจุบัน.
- การดำเนินไดเรกทอรีใหม่ NRTCachingDirectory, แคชส่วนเล็ก ๆ ในหน่วยความจำเพื่อลด I / O โหลดสำหรับการใช้งานได้อย่างรวดเร็วด้วยการเปิดอัตรา NRT.
- การดำเนินงานสะสมใหม่ CachingCollector คือสามารถที่จะรวบรวมเพลงฮิตค้นหา (รหัสเอกสารและเลือกที่จะยังคะแนน) และจากนั้นพวกเขาเล่น นี้จะเป็นประโยชน์สำหรับนักสะสมที่ต้องใช้สองคนหรือมากกว่าที่ผ่านมาจะให้ผลลัพธ์ที่.
- ดัชนีบล็อกเอกสารโดยใช้ IndexWriter ของ addDocuments ใหม่หรือวิธีการ updateDocuments เหล่านี้ API สำหรับการทดลองให้แน่ใจว่าบล็อกของเอกสารตลอดไปจะยังคงอยู่ต่อเนื่องกันในดัชนีที่ช่วยให้อนาคตที่น่าสนใจเช่นการจัดกลุ่มมีและร่วม.
- นโยบายผสานเริ่มต้นใหม่ TieredMergePolicy ซึ่งมีประสิทธิภาพมากขึ้นเนื่องจากความสามารถในการรวมกลุ่มที่ไม่อยู่ติดกัน.
- NumericField จะถูกส่งกลับในขณะนี้ได้อย่างถูกต้องเมื่อคุณโหลดเอกสารที่เก็บไว้ (ก่อนหน้านี้คุณได้รับสนามปกติกลับมีค่าตัวเลขสตริงแปลง).
มีอะไรใหม่ ในรุ่น 3.1.0:.
- ConstantScoreQuery ในขณะนี้ช่วยให้การตัดโดยตรงแบบสอบถาม
- IndexWriter มีการกำหนดค่าในขณะนี้กับผู้สร้างแยกต่างหาก API ใหม่, IndexWriterConfig ตอนนี้คุณสามารถควบคุมวงเงินกระทู้ภายใน IndexWriter คงก่อนหน้านี้โดยการเรียก setMaxThreadStates.
- IndexWriter.getReader จะถูกแทนที่ด้วย IndexReader.open (IndexWriter) นอกจากนี้คุณสามารถระบุได้ว่าลบควรจะแก้ไขเมื่อคุณเปิดอ่าน NRT.
- MultiSearcher จะเลิก; ParallelMultiSearcher ได้รับการดูดซึมโดยตรงใน IndexSearcher.
- ใน 64bit Windows และ Solaris JVMs, MMapDirectory อยู่ในขณะนี้การดำเนินงานเริ่มต้น (ส่งกลับโดย FSDirectory.open) MMapDirectory ยังช่วยให้ unmapping ถ้า JVM ที่สนับสนุน.
- ใหม่ TotalHitCountCollector เพียงแค่นับจำนวนของการเข้าชม.
- ReaderFinishedListener API ช่วยให้แคชภายนอกที่จะขับไล่รายการครั้งหนึ่งเคยเป็นส่วนที่จะเสร็จสิ้น.
มีอะไรใหม่ ในรุ่น 3.0.1:.
- ลบที่ไม่จำเป็นในการประสาน FuzzyTermEnum
- เมื่อการแก้ไขแง่ลบทำในลำดับการจัดเรียงยาวสำหรับประสิทธิภาพที่ดีขึ้น.
- อย่าให้ถูกต้องคำเตือนเกี่ยวกับระยะเดียวกันอันยิ่งใหญ่เมื่อ IndexWriter.infoStream อยู่บน.
- แก้ไข Min / MaxPayloadFunction กลับ 0 เมื่อเพียงหนึ่งบรรจุเป็นปัจจุบัน.
- แบบสอบถามประกอบด้วยทุกคำสั่งศูนย์เพิ่ม (ตัวอย่างเช่นข้อความ: foo ^ 0) เรียงไม่ถูกต้องและไม่ถูกต้องผลิต docids .
- ถอด ScoreTerm ระดับชั้นป้องกันจาก FuzzyQuery การเปลี่ยนแปลงเป็นสิ่งที่จำเป็นเพราะเปรียบเทียบของชั้นนี้ได้มีการเปลี่ยนแปลงในทางที่เข้ากันไม่ได้ ชั้นก็ไม่เคยตั้งใจจะให้ประชาชน.
สิ่งที่ใหม่ ในรุ่น 2.9.2:
- BooleanQuery ถูกละเลย disableCoord ใน hashCode และเท่ากับวิธีการ ก่อให้เกิดสิ่งที่ไม่ดีที่จะเกิดขึ้นเมื่อแคช BooleanQueries.
- อย่าให้ถูกต้องคำเตือนเกี่ยวกับระยะเดียวกันอันยิ่งใหญ่เมื่อ IndexWriter.infoStream อยู่บน.
- การจัดทำดัชนีในอัตราสูงอ่าน NRT ชั่วคราวอาจสูญเสียการลบ.
มีอะไรใหม่ ในรุ่น 3.0.0:
- ลบสถานที่ให้บริการระบบการตั้งค่าการใช้งานระดับ SegmentReader
- เปลี่ยนประเภทการกลับมาของภาพรวม SnapshotDeletionPolicy # () จาก IndexCommitPoint เพื่อ IndexCommit รหัสที่ใช้วิธีการนี้จะต้อง recompiled กับ Lucene 3.0 เพื่อที่จะทำงาน เลิกก่อนหน้านี้จะถูกลบออก IndexCommitPoint ยัง.
- ให้ AttributeFactory ที่สร้างความสะดวกสบายเช่น Token สำหรับคุณลักษณะพื้นฐานทั้งหมด.
- ลบเรียกซ้ำใน NumericRangeTermEnum.
- เพิ่มประสิทธิภาพการคำนวณระยะทาง Levenshtein ใน FuzzyQuery.
ความคิดเห็นที่ไม่พบ