建立索引的三大步
1.??????
數(shù)據(jù)轉(zhuǎn)換
Lucene
只支持text格式,所以要想對其他非text格式的文檔建立索引,首先的進行轉(zhuǎn)換。轉(zhuǎn)換后生成Document對象。
2.??????
Document
分析
Document
分析的過程是一個規(guī)范化,去糟粕取精華的過程。比如:全部轉(zhuǎn)為小寫(Wang到wang),轉(zhuǎn)為原型(running到run),去除連接詞(a、an、的)等等。
3.??????
寫索引文件
以反向索引的數(shù)據(jù)結(jié)構(gòu)存儲。