solo

          Solo是一個元搜索引擎,即從現有搜索引擎中提取數據的程序。

          統計

          留言簿(1)

          相關鏈接

          閱讀排行榜

          評論排行榜

          2005年1月13日 #

          Solo用途

          1. 產品即時比價,為購買產品提供參考;
          2. 產品規格收集;

          posted @ 2007-12-27 09:43 solo 閱讀(220) | 評論 (0)編輯 收藏

          20071220截圖

          結果頁面


           

          posted @ 2007-12-20 22:57 solo 閱讀(232) | 評論 (0)編輯 收藏

          TODOs and Issues

          TODO List:

          1. Identify attributes in a web page
          2. Deal with multiple attributes in a single line while comparing
          3. Show already mapped attributes in compare dialog
          4. Filter "related product" area to reduce # of hunks (by identifying instance URLs in webpage)
          5. Use 3rd party (oss) Java diff library, to remove "org.eclipse.compare" dependency
          6. [Web]Add attribute value filtering options in search page
          7. Add "washer" or "MessageFormat" to attribute entry
          8. Specify whether an attribute is long text (e.g. description) or image URL
          9. Add popularity property to ore, evaluate it by speed, usage, etc.
          10. Solo data partition
          11. Show downloading progress bar in web interface
          12. Added order property to Attribute
          13. Result page columns categorized by ores
          14. Give different thread pool size to user according to his level, default = 3
          15. Ores of a category should be derived, like attributes inheritance
          16. Solve the problem that one ore maps attributes differently in different categories
          17. Model advanced search of ores
          18. Automatically discover search url pattern of ores
          19. Convert relative HREFs to absolute so that they can be recongnized by instance url pattern
          20. Add test query keyword for Category (or Ore) as an attribute, for easy testing purpose
          21. Ability to map multiple attributes in web page to one
          22. Package as rcp product
          23. Mark as "not available" for an attribute of ores
          24. Cache most recent downloaded web pages, for re-compare purpose
          25. Remove tag content to reduce hunks
          26. Remove unique content in product url to reduce hunks

          Issue List:

          1. [Desktop]Concurrently download test pages in comparing dialog.
          2. Remove org.eclipse.swt dependency from solo model
          3. Instance url pattern of Ore should be multiple (allow an ore has multiple instance url pattern)
          4. Use relative path for default.solo
          5. Clear prior mapping when an attribute is assigned again, provide "remove mapping" button
          6. Add progress indicator for attribute extraction dialog while refresh comparison area
          7. Add as test instance URL when two URLs are entered to be compared
          8. Allow mapping multiple attributes in mapping dialog without pressing OK button
          9. Add add/remove category/attribute function
          10. Provide category selection function in editing ore dialog
          11. Replace compare area with Table for better performance

          posted @ 2007-12-17 19:39 solo 閱讀(299) | 評論 (0)編輯 收藏

          20071216截圖

          Web界面搜索結果的大概結構:


          posted @ 2007-12-16 23:00 solo 閱讀(189) | 評論 (0)編輯 收藏

          20071212網頁界面

          和離線編輯器比起來,供大多數人使用的web界面要簡單很多,如果不考慮用戶管理,大概就是一個搜索界面。

          posted @ 2007-12-13 00:01 solo 閱讀(191) | 評論 (0)編輯 收藏

          20071211離線編輯器截圖

          Solo的離線編輯器界面,其作用是編輯分類、屬性和Ore,作為在線查詢的后臺數據


          posted @ 2007-12-11 20:42 solo 閱讀(207) | 評論 (0)編輯 收藏

          Solo計劃發布Web版本

          為了讓使用者能更快體驗solo,solo計劃發布Web版本,第一個版本發布時間大約在08年3月底。

          posted @ 2007-12-10 11:30 solo 閱讀(200) | 評論 (0)編輯 收藏

          Solo at SourceForge.net

          Solo在SourceForge.net的申請終于通過了,可以通過http://sourceforge.net/projects/solo/訪問最新的Solo進展。

          posted @ 2005-03-10 09:21 solo 閱讀(382) | 評論 (0)編輯 收藏

          2005年3月3日截圖

          重新設計了透視圖結構,增加了Ontology下載管理功能,收藏夾功能。

          solo5.gif

          posted @ 2005-03-03 10:18 solo 閱讀(286) | 評論 (0)編輯 收藏

          選擇幾本書進行對比

          solo4.gif

          posted @ 2005-02-24 14:18 solo 閱讀(305) | 評論 (1)編輯 收藏

          兩個書店查詢“中國”的結果

          solo3.gif

          posted @ 2005-02-24 14:11 solo 閱讀(256) | 評論 (0)編輯 收藏

          待修改問題列表

          1、測試Ore是否可連接
          2、對沒有Instance的Subject的處理(例如yisou的查詢結果)
          3、數字類型欄的正確排序
          4、Index表格增加Retrive All命令
          5、對無法連接的Ore不進行Index處理,在結果里提示用戶該Ore無法連接
          6、運行環境只能為J2SDK 1.4.06版本的問題(必須修改
          7、查詢表格空間不夠時要可以滾動
          8、隱藏進度視圖
          9、保存查詢到收藏夾,實現“訂閱”功能
          10、圖形化編輯Ore模型代替Protege(大工程)
          11、提供Ore模型下載功能,Local File替換功能
          12、應用程序打包
          13、拆分Ore選擇、查詢表格和查詢結果為獨立View
          14、Index和Instance查詢結果分為獨立View,菜單分開
          15、記錄最新N條搜索歷史
          16、IndexJob和InstanceJob的改進,下載過程進度報告,取消操作響應
          17、修改Reload功能的bug
          18、實現Index->Instance的拖放和copy-paste操作
          19、允許用戶顯示/隱藏各視圖
          20、含有用javascript載入內容代碼的網頁處理(難題
          21、一個Field應該可以被多個Ore重用
          22、思考Ontology的發布模式

          新版solo的問題列表

          posted @ 2005-02-24 13:59 solo 閱讀(181) | 評論 (0)編輯 收藏

          Solo簡介

          什么是Solo?

          Solo是“Search OnLine Ores”的縮寫,可以把Solo想象成一個統一的搜索入口,目前的Web上有非常多的搜索引擎,其中很多是專用目的的,例如各種電子商務的搜索功能。每一個這樣的搜索引擎就是一個Ore,Solo做的是把它們按照類別集合起來,讓用戶輸入很少的查詢就能得到足夠結果,并且這些結果是結構化的。

          通過定義特定的本體,你可以為Solo增加更多的搜索功能。例如你可以搜書、搜數碼相機、搜新聞,通過讓Solo了解通用搜索引擎如Google,你當然也可以搜索任何“東西”。

          為了方便定義本體,Solo提供一個簡單有用的網頁內容提取器,和一個本體測試工具,配合專用的本體定義工具(如Protege),定義一個Ore的時間大約可以控制在30分鐘以內。當然,按照設想,一般用戶只要從網上下載別人定義好的本體直接使用即可。

          怎樣使用Solo?

          和所有程序一樣,用戶可以通過一個快捷方式啟動Solo。選擇自己要查詢的物品類別,例如“書”,然后在可選的Ore列表勾掉不希望的項,在系統自動生成的查詢表格里輸入查詢內容并按回車,稍后將在結果表格里看到查詢結果。

          此外,Solo還可以作為Eclipse的插件來使用(要求Eclipse 3.0或以上版本),使用界面基本不變。

          注意下圖中的查詢結果里標有“b”的表示由于網絡原因沒能成功獲取的信息,你可以Reload它們。

          posted @ 2005-01-13 20:56 solo 閱讀(24901) | 評論 (0)編輯 收藏

          主站蜘蛛池模板: 乡宁县| 嘉定区| 昭通市| 广南县| 谷城县| 乌什县| 武平县| 青神县| 旅游| 深泽县| 东辽县| 馆陶县| 宜兰市| 米泉市| 黔东| 师宗县| 分宜县| 邳州市| 安西县| 邹城市| 郸城县| 永清县| 水富县| 南汇区| 英德市| 连山| 佛山市| 无极县| 瑞安市| 汝城县| 裕民县| 文成县| 驻马店市| 石屏县| 吉木萨尔县| 婺源县| 都昌县| 漯河市| 永康市| 左权县| 山东|