馬可波羅的夢鄉(xiāng)

          BlogJava 首頁 新隨筆 聯(lián)系 聚合 管理
            4 Posts :: 50 Stories :: 2 Comments :: 0 Trackbacks
          Luke
          雖然剛剛開始,但是可以確定這是一個非常有用的工具。通過這個工具也可以更深入地了解Lucene的索引機制。
          Luke具有解釋文檔評分機制的特性,可以幫助我們了解文檔的評分機制

          1、在Document標簽可以看到,每個document都有對應(yīng)的Flag。Flag的意義做如下摘錄(之前沒有這個概念啊,看這個頁面才知道這個概念的)
          ITSVopfOLBC
          I: indexed,    T:Tokenized(是分詞的意思吧。我原來設(shè)置docName需要分詞,而url就不需要分詞了)   S:Stored (都是存下來了吧,設(shè)置不存,會找不到記錄?可以通過分詞后的term找到該doc,但是docName得不到,因為沒有設(shè)置為Store,貌似遇到過這個問題)
          V:Term Vector(詞向量?這個名詞看起來有些高深...)   o: offset   p:positions
          O:Omit Norms
          f:Omit TF(tf是term出現(xiàn)的頻率?)
          L: Lazy 這個是干什么,刪除時的標記嗎? 為了提升效率好像開始刪除時,并沒有真正刪除,而僅僅是做了一個標記。最后優(yōu)化時,才會做物理刪除(對Flash的處理用這種方式挺多的,可以深入研究這種機制)
          posted on 2009-09-23 06:03 夢回唐朝 閱讀(141) 評論(0)  編輯  收藏 所屬分類: Tools

          只有注冊用戶登錄后才能發(fā)表評論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 宁波市| 诏安县| 中卫市| 广西| 娱乐| 玉溪市| 杭锦旗| 瑞昌市| 西城区| 金山区| 梅河口市| 嘉义市| 涿鹿县| 西华县| 灵山县| 西安市| 阆中市| 蒙山县| 新干县| 瑞安市| 交城县| 阿拉善盟| 阿克陶县| 岑巩县| 兴化市| 苗栗县| 高密市| 长海县| 垫江县| 泗阳县| 田林县| 土默特左旗| 乌兰察布市| 咸阳市| 绥滨县| 饶平县| 五大连池市| 吉首市| 海原县| 阿克苏市| 靖宇县|