J自由空間

          記錄人生的地方

          商業智能與實驗室智能

          Blog剛開張說些什么好呢?就談一談學術界流行的數據挖掘吧。
          ???數據挖掘本來就是數據分析,用數學和統計的方法分析已有的數據??墒沁@個概念在商業上和學術上卻產生的天地一般的差別,在商業上,數據挖掘指的實際就是數據庫的整合和查詢,最多加上一些非常簡單的算法,比如關聯,就成了所謂的數據挖掘系統,再者就干脆理解為OLAP和報表制作;而學術上呢?要是你翻開Datamining的教科書或者論文集,你要擔心了,除非你是個數學系的畢業生,否則你絕對不會理解里面概念、公式和結論。為什么有這么大的差別呢?從軟件工程的角度來看,原來商人和學者的需求完全不同,商人不需要高深的理論,什么樣的工具對生意有用,對管理有用,就用什么工具,最好直觀可信易懂;但學者正好相反,要發表論文沒有創新不行,因此越來越多艱深的理論被寫入論文。這樣造就了兩個截然不同的數據挖掘領域。
          ???其實要說都不一樣也不確切,許多優秀可行的分析方法在時間的考驗中沉淀下來,逐步進入了商業領域,同時商業管理系統包括ERP,CRM也越來越注重新方法的應用,看來商業和學術也不是兩條平行線。
          ???我們java人能做什么呢?看到許多領域:B/S、GIS、ERP、CAD乃至數據庫都有相應的開源軟件群了,而數據分析和挖掘卻一直很少人問津,并不是它沒有用,而是DM要求的門檻較高,更需要耐心和恒心,因此希望越來越多的人關注開源數據分析/挖掘的實現。

          posted on 2007-01-02 16:06 Lieffert Liu 閱讀(794) 評論(2)  編輯  收藏

          Feedback

          # re: 商業智能與實驗室智能 2007-01-02 17:46 DMer

          數據挖掘在商業上大規模真正的應用還有待時日,特別在大陸。
          pentaho如果較好融合了weka,應該是個有前途的BI開源工具  回復  更多評論   

          # re: 商業智能與實驗室智能 2007-01-03 15:54 Lieffert Liu

          其實有很多很好的開源項目沒人問津。  回復  更多評論   



          只有注冊用戶登錄后才能發表評論。


          網站導航:
           

          My Links

          Blog Stats

          常用鏈接

          留言簿(1)

          隨筆分類

          隨筆檔案

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 伊宁县| 郎溪县| 陈巴尔虎旗| 当阳市| 澎湖县| 乌什县| 贡嘎县| 塔城市| 苏尼特左旗| 海淀区| 分宜县| 灵武市| 内江市| 井陉县| 盱眙县| 梁山县| 团风县| 南川市| 若尔盖县| 西吉县| 古浪县| 青铜峡市| 故城县| 北宁市| 赤城县| 津南区| 新疆| 彭水| 文昌市| 肇庆市| 固镇县| 卫辉市| 颍上县| 金沙县| 光泽县| 建昌县| 华阴市| 云霄县| 洛南县| 二连浩特市| 嘉禾县|