天 霽

          那天風大,搜搜的
          posts - 4, comments - 36, trackbacks - 1, articles - 1
            BlogJava :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

          2006年10月18日

               摘要: 好久沒回來了,終于有時間可以更新這個小工具了。
          修改的地方:
          1、區分數據存儲的實際目錄;
          2、可以反復查詢不同的目錄數據;
          3、數據導出為CVS文件;
          4、其他一些小bug;
          5、修改status的表現內容  閱讀全文

          posted @ 2007-06-29 22:41 天霽 閱讀(1624) | 評論 (13)編輯 收藏

               摘要: 在nutch的開發過程中,很多程序員都煩惱nutch抓取數據后的保存格式,無法被直接瀏覽和管理,我也同樣煩惱,呵呵,也是被人催得急了,抽出時間寫了這么個小工具,用來瀏覽nutch保存的數據。  閱讀全文

          posted @ 2006-12-16 16:10 天霽 閱讀(3605) | 評論 (15)編輯 收藏

               摘要: Nutch采用了類似Eclipse的插件方法來擴展功能,具有良好的擴展性和耦合性,本文嘗試對QueryFilter的所有子類的加載過程簡單分析。  閱讀全文

          posted @ 2006-12-02 21:39 天霽 閱讀(2627) | 評論 (5)編輯 收藏

               摘要: nutch作為開源代碼,為熱愛搜索引擎的開發人員們提供了很好的學習平臺,0.8版本開始,采用了Hadoop作為自己的分布式文件系統,更是把nutch同其他開源搜索引擎的差距拉開。

          本文為nutch的windows安裝進行了step by step的描述  閱讀全文

          posted @ 2006-10-18 19:52 天霽 閱讀(7333) | 評論 (4)編輯 收藏

          主站蜘蛛池模板: 大方县| 新龙县| 中阳县| 鹤壁市| 莱芜市| 且末县| 河源市| 叙永县| 哈巴河县| 封开县| 吉木萨尔县| 麻栗坡县| 三江| 新河县| 哈密市| 从江县| 台南县| 兴海县| 桐梓县| 金堂县| 南宁市| 望奎县| 新晃| 凭祥市| 红桥区| 五指山市| 广饶县| 麻阳| 汤阴县| 佛坪县| 灌南县| 新津县| 栾城县| 柘荣县| 赫章县| 南木林县| 乌兰察布市| 钦州市| 泸水县| 梁河县| 晋宁县|