隨筆 - 10, 文章 - 0, 評論 - 2, 引用 - 0
          數據加載中……

          2005年11月28日

          tss中文:開源面向對象的數據庫db4o 5.5版發布了

          ?tss中文:開源面向對象的數據庫db4o 5.5版發布了

          近日db4objects發布了開源面向對象數據庫 db4o 5.5 版本. 這個版本的焦點是提高了性能降低了內存耗用,特別針對資源緊張的嵌入式開發提供了支持。

          具體的改進特性:
          - 類索引使用新BTree架構,極大減少了事務提交的時間,對象個數在10萬之1千萬的索引時表現極為明顯。
          -通過更好的群集插槽方式,改進字符串和數組的序列化方式,在插入和修改時提高了效率。

          -提供了診斷工具包,幫助程序員更容易開發出高效程序。

          -本次改進效率的提升可以讓內存耗用更低。


          伴隨著?這次發布,db4objects 還提供了用戶交流社區:
          這里 。??

          原文: db4o open source object database v 5.5 released

          posted @ 2006-08-21 18:25 我要去桂林 閱讀(244) | 評論 (0)編輯 收藏

          一種面向搜索引擎的網頁分塊、切片的原理,實現和演示

          一種面向搜索引擎的網頁分塊、切片的原理,實現和演示



          最近看到 2005 年的 全國搜索引擎和網上信息挖掘學術研討會 上 華南木棉信息檢索的隊長 歐健文 的 華南木棉信息檢索 的ppt。很有啟發。

          于是自己也根據自己的理解準備做一個實現。
          實現前提假設:
              1、網頁分塊切分的基本單位是html中的table , div 等標簽(目前版本只支持:table ,div 標簽)。
              2、網頁分塊切片識別依賴于相似url的對比。比如:我們認為一下兩個url的網頁html文本結構相似:
                  http://news.soufun.com/2005-11-26/580107.htm
                  http://news.soufun.com/2005-11-26/580175.htm
                 而下面兩個url的網頁結構不相似:
                  http://news.soufun.com/subject/weekly051121/index.html
                  http://news.soufun.com/2005-11-26/580175.htm

          用途:
              1、根據分析網頁結構區分網頁是 主題型網頁 還是 目錄型網頁;
              2、根據分析網頁結構 找出 網頁的 主題內容,相關內容和噪音內容;

          實現的3個階段:
              1、對網頁結構進行合理切片;
              2、比較相似網頁的切片結構;
              3、分析切片數據,得出結論。
          演示地址:
                 http://www.domolo.com:8090/domoloWeb/html-page-slice.jsp


          posted @ 2005-11-28 10:17 我要去桂林 閱讀(650) | 評論 (0)編輯 收藏

          主站蜘蛛池模板: 屏东县| 临夏市| 东乌珠穆沁旗| 德兴市| 张北县| 宝应县| 九龙坡区| 扎囊县| 体育| 台东市| 彩票| 莎车县| 根河市| 多伦县| 时尚| 临洮县| 博白县| 宁阳县| 中西区| 顺昌县| 沧州市| 上林县| 金山区| 旬阳县| 东阿县| 于田县| 仁化县| 页游| 金门县| 麟游县| 泽州县| 广安市| 金秀| 浙江省| 安陆市| 襄樊市| 开封县| 枝江市| 蓬莱市| 普陀区| 西城区|