bbmonkey62笨笨猴

中文分詞

BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合

:: 管理 ::

2 隨筆 :: 0 文章 :: 38 評論 :: 0 Trackbacks

<

2025年7月

>

日

一

二

三

四

五

六

29

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

公告

java

常用鏈接

留言簿(2)

隨筆檔案(2)

友好鏈接

子猴搜索引擎

搜索

閱讀排行榜

評論排行榜

我的評論

re: 對搜索引擎同義詞支持的實驗, 分析模擬 bbmonkey62笨笨猴 2010-08-16 10:02

目前所有的搜索引擎都只是按關鍵詞查找內容，最多也只是做了一些很簡單的處理，比如搜索：武大，可能會把武漢大學也搜索出來，但像你這篇文章中提到的，現在還沒有搜索引擎能做到。
以后的搜索引擎可能會在智能程度提高，但難度也是非常大的。

re: Lucene源碼分析筆記之[org.apache.lucene.store]（二） bbmonkey62笨笨猴 2009-10-20 12:08

寫得很好

re: 解決在lucene中應用高亮顯示所遇到的問題及ShuzhenAnalyzer-1.1.6發布 bbmonkey62笨笨猴 2009-04-17 17:38

請在2009-04-17下午5點35分以前下過1.1.6版本的朋友們再重新下一遍，由于我之前測試得不夠嚴密，5點35分以前的1.1.6版本在對搜索詞進行處理（segmentKeyExact（key）和segmentKeyFuzzy（key））時，當搜索詞是某種組合的時候會導致比較嚴重的錯誤，其他功能沒有發現問題，非常抱歉，敬請諒解

re: 解決在lucene中應用高亮顯示所遇到的問題及ShuzhenAnalyzer-1.1.6發布 bbmonkey62笨笨猴 2009-04-17 14:54

@mrzhu
在建立索引時，lucene是支持索引非文本數據的，我不知道你在索引的時候是怎么用的，但我建議你去看如下內容：
在org.apache.lucene.document.Field里的構造方法：
public Field(String name, byte[] value, Store store)
請留意第二個參數，在建立索引的時候允許非文本的字符，比如大文件類型轉換為byte[]型索引起來，然后你取的時候再做相應的轉換

我沒做測試，你可以去測試下是否可行，我覺得是可以的。。。