J自由空間

          記錄人生的地方

          商業智能與實驗室智能

          Blog剛開張說些什么好呢?就談一談學術界流行的數據挖掘吧。
          ???數據挖掘本來就是數據分析,用數學和統計的方法分析已有的數據。可是這個概念在商業上和學術上卻產生的天地一般的差別,在商業上,數據挖掘指的實際就是數據庫的整合和查詢,最多加上一些非常簡單的算法,比如關聯,就成了所謂的數據挖掘系統,再者就干脆理解為OLAP和報表制作;而學術上呢?要是你翻開Datamining的教科書或者論文集,你要擔心了,除非你是個數學系的畢業生,否則你絕對不會理解里面概念、公式和結論。為什么有這么大的差別呢?從軟件工程的角度來看,原來商人和學者的需求完全不同,商人不需要高深的理論,什么樣的工具對生意有用,對管理有用,就用什么工具,最好直觀可信易懂;但學者正好相反,要發表論文沒有創新不行,因此越來越多艱深的理論被寫入論文。這樣造就了兩個截然不同的數據挖掘領域。
          ???其實要說都不一樣也不確切,許多優秀可行的分析方法在時間的考驗中沉淀下來,逐步進入了商業領域,同時商業管理系統包括ERP,CRM也越來越注重新方法的應用,看來商業和學術也不是兩條平行線。
          ???我們java人能做什么呢?看到許多領域:B/S、GIS、ERP、CAD乃至數據庫都有相應的開源軟件群了,而數據分析和挖掘卻一直很少人問津,并不是它沒有用,而是DM要求的門檻較高,更需要耐心和恒心,因此希望越來越多的人關注開源數據分析/挖掘的實現。

          posted on 2007-01-02 16:06 Lieffert Liu 閱讀(791) 評論(2)  編輯  收藏

          Feedback

          # re: 商業智能與實驗室智能 2007-01-02 17:46 DMer

          數據挖掘在商業上大規模真正的應用還有待時日,特別在大陸。
          pentaho如果較好融合了weka,應該是個有前途的BI開源工具  回復  更多評論   

          # re: 商業智能與實驗室智能 2007-01-03 15:54 Lieffert Liu

          其實有很多很好的開源項目沒人問津。  回復  更多評論   



          只有注冊用戶登錄后才能發表評論。


          網站導航:
           

          My Links

          Blog Stats

          常用鏈接

          留言簿(1)

          隨筆分類

          隨筆檔案

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 那坡县| 平塘县| 白水县| 晴隆县| 仙桃市| 噶尔县| 鄂托克旗| 扶绥县| 崇信县| 江源县| 莲花县| 浦县| 永靖县| 嵩明县| 孝昌县| 贵德县| 石泉县| 离岛区| 九龙县| 固始县| 睢宁县| 阿瓦提县| 军事| 双桥区| 永修县| 山阳县| 扶沟县| 三门县| 靖边县| 亳州市| 思茅市| 滕州市| 禄丰县| 龙井市| 湛江市| 凤庆县| 青海省| 五原县| 肥乡县| 瓦房店市| 杭州市|