J自由空間

          記錄人生的地方

          商業智能與實驗室智能

          Blog剛開張說些什么好呢?就談一談學術界流行的數據挖掘吧。
          ???數據挖掘本來就是數據分析,用數學和統計的方法分析已有的數據。可是這個概念在商業上和學術上卻產生的天地一般的差別,在商業上,數據挖掘指的實際就是數據庫的整合和查詢,最多加上一些非常簡單的算法,比如關聯,就成了所謂的數據挖掘系統,再者就干脆理解為OLAP和報表制作;而學術上呢?要是你翻開Datamining的教科書或者論文集,你要擔心了,除非你是個數學系的畢業生,否則你絕對不會理解里面概念、公式和結論。為什么有這么大的差別呢?從軟件工程的角度來看,原來商人和學者的需求完全不同,商人不需要高深的理論,什么樣的工具對生意有用,對管理有用,就用什么工具,最好直觀可信易懂;但學者正好相反,要發表論文沒有創新不行,因此越來越多艱深的理論被寫入論文。這樣造就了兩個截然不同的數據挖掘領域。
          ???其實要說都不一樣也不確切,許多優秀可行的分析方法在時間的考驗中沉淀下來,逐步進入了商業領域,同時商業管理系統包括ERP,CRM也越來越注重新方法的應用,看來商業和學術也不是兩條平行線。
          ???我們java人能做什么呢?看到許多領域:B/S、GIS、ERP、CAD乃至數據庫都有相應的開源軟件群了,而數據分析和挖掘卻一直很少人問津,并不是它沒有用,而是DM要求的門檻較高,更需要耐心和恒心,因此希望越來越多的人關注開源數據分析/挖掘的實現。

          posted on 2007-01-02 16:06 Lieffert Liu 閱讀(791) 評論(2)  編輯  收藏

          Feedback

          # re: 商業智能與實驗室智能 2007-01-02 17:46 DMer

          數據挖掘在商業上大規模真正的應用還有待時日,特別在大陸。
          pentaho如果較好融合了weka,應該是個有前途的BI開源工具  回復  更多評論   

          # re: 商業智能與實驗室智能 2007-01-03 15:54 Lieffert Liu

          其實有很多很好的開源項目沒人問津。  回復  更多評論   



          只有注冊用戶登錄后才能發表評論。


          網站導航:
           

          My Links

          Blog Stats

          常用鏈接

          留言簿(1)

          隨筆分類

          隨筆檔案

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 绥中县| 独山县| 隆子县| 池州市| 寻乌县| 锡林郭勒盟| 如东县| 霍城县| 郓城县| 佛坪县| 微山县| 株洲市| 宜宾市| 本溪市| 屏山县| 开阳县| 德钦县| 安西县| 澄江县| 普格县| 海晏县| 蕉岭县| 新郑市| 曲周县| 城口县| 岱山县| 山东| 博湖县| 淮南市| 金塔县| 石首市| 武安市| 来凤县| 应用必备| 高要市| 科尔| 新河县| 安溪县| 平陆县| 和龙市| 静宁县|