Apache Lucene是一个开放源程序的搜索引擎,利用它可以轻易地为Java软件加入全文搜索功能。Lucene的最主要工作是替文件的每一个字作索引,索引让搜索的效率比传统的逐字比较大大提高,Lucen提供一组解读,过滤,分析文件,编排和使用索引的API,它的强大之处除了高效和简单外,是最重要的是使使用者可以随时应自已需要自订其功能。 Lucene是apache软件基金会项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现 全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
Apache Lucene 3.4.0 发布了,该版本包含很多的bug修复,优化和改进,主要改进如下:
1.新增了连接模块,可以使用BlockJoinQuery/Collector来检索和搜索文档。
2.现在可以通过常用术语来搜索出相应的文档。
3.QueryParser模块可以用来创建NumericRangeQuery。
4.新增了SynonymFilter,支持多个同义词检索。
5.可以使用SortField.setMissingValue来控制文档的排序。
6.修复了一个主要的bug (LUCENE-3418) 该问题在操作系统或者计算机崩溃的时候会导致索引被破坏。
如果你正在使用 Apache Lucene 3.1, 3.2 or 3.3 ,那我们强烈建议你立即升级到该版本。
下载地址:
http://www.apache.org/dyn/closer.cgi/lucene/java
原文:http://tech.it168.com/a2011/0916/1247/000001247362.shtml