JAVA開源與搜索技術

好東西拿來，何樂而不為？

posts - 5, comments - 5, trackbacks - 0, articles - 1

聚合

Lucene中Field的類型

Posted on 2007-01-26 17:36 王睿閱讀(1323) 評論(0) 編輯收藏所屬分類: 搜索技術

1.?????? 2.0 以前的版本

Keyword: Field 的值將被保存到索引文件，為Field的值建立索引，建立索引時不需要分詞。
UnIndexed: Field 的值將被保存到索引文件，不為Field的值建立索引，因此不能通過該Field搜索文檔。
UnStored: Field 的值不被保存到索引文件，將Field的值分詞后建立索引
Text: Field 的值分詞后建立索引。如果參數為String值將被保存，為Reader值不被保存

2.?????? 2.0 版本
? 用幾個內部類的組合來區分Field的具體類型。

Store

2??????? COMPRESS: 壓縮保存。用于長文本或二進制數據

2??????? YES ：保存

2??????? NO ：不保存

Index

2??????? NO ：不建索引

2??????? TOKENIZED ：分詞， 建索引

2??????? UN_TOKENIZED ：不分詞， 建索引

2??????? NO_NORMS ：不分詞， 建索引。但是Field的值不像通常那樣被保存，而是只取一個byte，這樣節約存儲空間

TermVector

2??????? NO ：不保存term vectors

2??????? YES ：保存term vectors。

2??????? WITH_POSITIONS ：保存term vectors。（保存值和token位置信息）

2??????? WITH_OFFSETS ：保存term vectors。（保存值和Token的offset）WITH_POSITIONS_OFFSETS：保存term vectors。（保存值和token位置信息和Token的offset）

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: Lucene索引性能調整測試結果提高Lucene索引性能搜索的前提：建立索引 Lucene中Field的類型

<

2007年1月

>

日

一

二

三

四

五

六

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

盡量保證每一篇文章都是我自己寫的，希望每一文章都不浪費大家的時間。

JAVA開源與搜索技術

Lucene中Field的類型

常用鏈接

留言簿(2)

隨筆分類(6)

隨筆檔案(5)

搜索

最新評論

閱讀排行榜

評論排行榜