Lucene1.4与Lucene2.0的Field - 小嘴冰凉 - ITeye博客

`

小嘴冰凉

浏览: 448668 次
性别:
来自: 北京

最近访客更多访客>>

leisure0422

kxlele

mx25184

czl026

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

hanmiao：注释掉的那壹行少了壹個斜线，楼主...
servlet导出excel
天下无贼： Thread.Interrupt方法，只是通过扔出异常的方式， ...
Java Thread.interrupt 害人！中断JAVA线程（zz）
天下无贼：呵呵，是你自己写错了。
Java Thread.interrupt 害人！中断JAVA线程（zz）
MO_ZHUANG_D：如果是真的就感激不尽了
Axure RP教程
小嘴冰凉：在开始执行的时候，如果是数据库存储，程序会从数据库中查job信 ...
quartz的持久化

Lucene1.4与Lucene2.0的Field

博客分类：

lucene

阅读更多

Field的改进
Lucene1.4主要提供下列四种不同类型的Field:
Keyword,UnStored,UnIndexed,Text

在Lucene2.0中是通过三个内部类Field.Index,Field.Store,Field.termVector(项向量)的组合来区分Field的具体类型.具体如下:
Field.Store.COMPRESS:压缩保存,用于长文本或二进制数据
Field.Store.YES:保存
Field.Store.NO:不保存

Field.Index.NO:不建立索引
Field.Index.TOKENIZED:分词,建索引
Field.Index.UN_TOKENIZED:不分词,建索引
Field.Index.NO_NORMS:不分词,建索引.但是Field的值不像通常那样被保存，而是只取一个byte，这样节约存储空间

Field.TermVector.NO:不保存term vectors
Field.TermVector.YES:保存term vectors
Field.TermVector.WITH_POSITIONS:保存term vectors.(保存值和token位置信息)
Field.TermVector.WITH_OFFSETS:保存term vectors.(保存值和Token的offset)
Field.TermVector.WITH_POSITIONS_OFFSETS:保存term vectors.(保存值和token位置信息和Token的offset)

而Field的构造函数也用到了这三个内部类:
Field(String, byte[],Field.Store)
Field(String, Reader)
Field(String, Reader, Field.TermVector)
Field(String, String, Field.Store, Field.Index)
Field(String, String, Field.Store, Field.Index, Field.TermVector)

其中Field(String, Reader)和Field(String, Reader, Field.TermVector)默认为Field.Index.TOKENIZED和Field.Store.NO的.我们可以很简单的建立起1.4版本的Field类型和2.0间的转换(这看上去似乎没有什么必要,只是觉得对于理解还是有点帮助的)
Keyword <==> Store.YES,Index.UN_TOKENIZED;
UnIndexed <==> Store.YES,Index.NO;
UnStored <==> Store.NO,Index.TOKENIZED;
Text(String, Reader) <==> Store.NO,Index.TOKENIZED;
Text(String,String) <==> Store.YES,Index.TOKENIZED.

分享到：

数据库中事务机制的进阶使用（整理） | JQuery

2009-08-31 13:30
浏览 1004
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

lucene1.4: lucene1.4工具包

lucene 2.0 api以及lucene 3.0 api: 全面好用的lucene 2.0 api以及lucene 3.0 api帮助文档

Lucene.Net.dll 2.0: Lucene.Net 2.0 已编译 dll

Lucene-2.0学习文档: NULL 博文链接：https://fishhappy365.iteye.com/blog/456739

Lucene.Net.rar 2.0 ver asp.net 组件: Lucene.Net.rar 2.0 ver asp.net 组件功能强大放到 Bin 下面

Lucene.net 2.0 API + DLL 下载: Lucene.net 2.0 API,Lucene.net 2.0 dll,Lucene.net学习探索着必备。

lucene-1.4-final: lucene-1.4-final非src

Lucene.Net2.0(C#): lucene.net 2.0的全文检索源代码

Lucene.Net 2.0 源码＋文档: Lucene.Net 2.0 源码＋文档

Lucene.2.0.API: Lucene.2.0的API文档合集是从html装成chm的

lucene-2.0: lucene-2.0开发专用

最新版Lucene.Net盘古分词2.0: 支持全文索引Lucene.Net4.8版本，最新版盘古分词2.0

lucene jar包: 包含Lucene三个jar包：Lucene3.0.3、lucene1.4,

开发自己的搜索引擎《lucene2.0+heritrix》一书对应的源码资料: 开发自己的搜索引擎《lucene2.0+heritrix》一书对应的源码资料,总共有30M,只上传了几个例子. ch2-lucene入门小例子 myReserch-可用的网络搜索引擎

lucene2.0与其分词工具包: lucene java 搜索引擎比较经典的全文搜索引擎，最近发现在官方网站上找不到了，放在这里给大家，方便点，多谢谢支持！

struts2 + spring2.5 + hibernate 3.2 + lucene 2.4 + compass 2.0产品搜索: struts2 + spring2.5 + hibernate 3.2 + lucene 2.4 + compass 2.0 包含所有jar包，按readme.txt导入并运行即可开始不用分了................

Lucene.Net-2.0.doc: Lucene.Net-2.0.doc 更多信息请查看 www.iubang.com

lucene2.0+Heritrix配套源码: 本软件是开发自己的搜索引擎《lucene2.0+heritrix》一书对应的源码资料，不过由于代码很大，只发布其中最全的部分，各章的源码就不发了。

lucene中文分词公用组件V2.0: import org.apache.lucene.analysis.TokenStream; import org.mira.lucene.analysis.MIK_CAnalyzer; public class TestLucene { /** * @param args */ public static void main(String[] args) { String...

lucene jar大全包涵多个版本的jar包2.0-4.1等: lucene jar包大全 lucene-2.0.jar lucene-3.0.2.jar lucene-3.6.2.jar lucene-4.2.1.jar

Global site tag (gtag.js) - Google Analytics