隨筆 - 10, 文章 - 0, 評論 - 2, 引用 - 0
          數(shù)據(jù)加載中……

          2005年11月28日

          tss中文:開源面向?qū)ο蟮臄?shù)據(jù)庫db4o 5.5版發(fā)布了

          ?tss中文:開源面向?qū)ο蟮臄?shù)據(jù)庫db4o 5.5版發(fā)布了

          近日db4objects發(fā)布了開源面向?qū)ο髷?shù)據(jù)庫 db4o 5.5 版本. 這個版本的焦點是提高了性能降低了內(nèi)存耗用,特別針對資源緊張的嵌入式開發(fā)提供了支持。

          具體的改進(jìn)特性:
          - 類索引使用新BTree架構(gòu),極大減少了事務(wù)提交的時間,對象個數(shù)在10萬之1千萬的索引時表現(xiàn)極為明顯。
          -通過更好的群集插槽方式,改進(jìn)字符串和數(shù)組的序列化方式,在插入和修改時提高了效率。

          -提供了診斷工具包,幫助程序員更容易開發(fā)出高效程序。

          -本次改進(jìn)效率的提升可以讓內(nèi)存耗用更低。


          伴隨著?這次發(fā)布,db4objects 還提供了用戶交流社區(qū):
          這里 。??

          原文: db4o open source object database v 5.5 released

          posted @ 2006-08-21 18:25 我要去桂林 閱讀(247) | 評論 (0)編輯 收藏

          一種面向搜索引擎的網(wǎng)頁分塊、切片的原理,實現(xiàn)和演示

          一種面向搜索引擎的網(wǎng)頁分塊、切片的原理,實現(xiàn)和演示



          最近看到 2005 年的 全國搜索引擎和網(wǎng)上信息挖掘?qū)W術(shù)研討會 上 華南木棉信息檢索的隊長 歐健文 的 華南木棉信息檢索 的ppt。很有啟發(fā)。

          于是自己也根據(jù)自己的理解準(zhǔn)備做一個實現(xiàn)。
          實現(xiàn)前提假設(shè):
              1、網(wǎng)頁分塊切分的基本單位是html中的table , div 等標(biāo)簽(目前版本只支持:table ,div 標(biāo)簽)。
              2、網(wǎng)頁分塊切片識別依賴于相似url的對比。比如:我們認(rèn)為一下兩個url的網(wǎng)頁html文本結(jié)構(gòu)相似:
                  http://news.soufun.com/2005-11-26/580107.htm
                  http://news.soufun.com/2005-11-26/580175.htm
                 而下面兩個url的網(wǎng)頁結(jié)構(gòu)不相似:
                  http://news.soufun.com/subject/weekly051121/index.html
                  http://news.soufun.com/2005-11-26/580175.htm

          用途:
              1、根據(jù)分析網(wǎng)頁結(jié)構(gòu)區(qū)分網(wǎng)頁是 主題型網(wǎng)頁 還是 目錄型網(wǎng)頁;
              2、根據(jù)分析網(wǎng)頁結(jié)構(gòu) 找出 網(wǎng)頁的 主題內(nèi)容,相關(guān)內(nèi)容和噪音內(nèi)容;

          實現(xiàn)的3個階段:
              1、對網(wǎng)頁結(jié)構(gòu)進(jìn)行合理切片;
              2、比較相似網(wǎng)頁的切片結(jié)構(gòu);
              3、分析切片數(shù)據(jù),得出結(jié)論。
          演示地址:
                 http://www.domolo.com:8090/domoloWeb/html-page-slice.jsp


          posted @ 2005-11-28 10:17 我要去桂林 閱讀(654) | 評論 (0)編輯 收藏

          主站蜘蛛池模板: 兴城市| 永春县| 霍州市| 德州市| 金溪县| 桦川县| 玉门市| 富川| 阳谷县| 大埔县| 甘谷县| 监利县| 胶州市| 孟州市| 泰安市| 瑞安市| 新余市| 南皮县| 吐鲁番市| 武安市| 若羌县| 武威市| 南乐县| 察哈| 湖北省| 葫芦岛市| 永昌县| 铅山县| 石柱| 嘉兴市| 兴安县| 巴彦淖尔市| 耿马| 禹城市| 通江县| 边坝县| 普洱| 彩票| 宁武县| 西青区| 富阳市|