huangfox

          韜光隱晦
          隨筆 - 1, 文章 - 8, 評論 - 1, 引用 - 0
          數據加載中……

          有關Lucene的問題(6):Lucene的事務性【轉】

            所謂事務性,本多指數據庫的屬性,包括ACID四個基本要素:原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久性(Durability)。

            我們這里主要討論隔離性,Lucene的IndexReader和IndexWriter具有隔離性。

            當IndexReader.open打開一個索引的時候,相對于給當前索引進行了一次snapshot,此后的任何修改都不會被看到。

            僅當IndexReader.open打開一個索引后,才有可能看到從上次打開后對索引的修改。

            當IndexWriter沒有調用Commit的時候,其修改的內容是不能夠被看到的,哪怕IndexReader被重新打開。

            欲使最新的修改被看到,一方面IndexWriter需要commit,一方面IndexReader重新打開。

            下面我們舉幾個例子來說明上述隔離性:

            (1) 首先做準備,索引十篇文檔

            File indexDir = new File("TestIsolation/index");
            IndexWriter writer = new IndexWriter(FSDirectory.open(indexDir), new StandardAnalyzer(Version.LUCENE_CURRENT), true, IndexWriter.MaxFieldLength.LIMITED);
            for(int i =0; i < 10; i++){
            indexDocs(writer);
            }
            writer.close();

            (2) 然后再索引十篇文檔,并不commit

            writer = new IndexWriter(FSDirectory.open(indexDir), new StandardAnalyzer(Version.LUCENE_CURRENT), IndexWriter.MaxFieldLength.LIMITED);
            for(int i =0; i < 10; i++){
            indexDocs(writer);
            }

            (3) 打開一個IndexReader,但是由于IndexWriter沒有commit,所以仍然僅看到十篇文檔。

            IndexReader reader = IndexReader.open(FSDirectory.open(indexDir));
            IndexSearcher searcher = new IndexSearcher(reader);
            TopDocs docs = searcher.search(new TermQuery(new Term("contents","hello")), 50);
            System.out.println(docs.totalHits);

            (4) IndexWriter進行提交commit

            writer.commit();

            (5) 不重新打開IndexReader,進行搜索,仍然僅看到十篇文檔。

            docs = searcher.search(new TermQuery(new Term("contents","hello")), 50);
            System.out.println(docs.totalHits);

            (6) IndexReader重新打開,則可以看到二十篇文檔。

            reader = IndexReader.open(FSDirectory.open(indexDir));
            searcher = new IndexSearcher(reader);
            docs = searcher.search(new TermQuery(new Term("contents","hello")), 50);
            System.out.println(docs.totalHits);

          posted on 2010-09-25 16:02 fox009 閱讀(161) 評論(0)  編輯  收藏 所屬分類: 搜索引擎技術

          主站蜘蛛池模板: 佛学| 汝州市| 祁连县| 辽宁省| 广灵县| 重庆市| 富锦市| 天全县| 新源县| 靖江市| 信阳市| 弥勒县| 神木县| 突泉县| 抚顺县| 朝阳区| 沧州市| 吉隆县| 达州市| 郯城县| 巴彦县| 杭锦旗| 大名县| 隆昌县| 砀山县| 军事| 徐闻县| 高邮市| 马龙县| 莱阳市| 金堂县| 香港| 邓州市| 昔阳县| 章丘市| 德昌县| 城固县| 兴隆县| 通州区| 桓仁| 尚义县|