商業(yè)智能與實(shí)驗(yàn)室智能
Blog剛開(kāi)張說(shuō)些什么好呢?就談一談學(xué)術(shù)界流行的數(shù)據(jù)挖掘吧。
???數(shù)據(jù)挖掘本來(lái)就是數(shù)據(jù)分析,用數(shù)學(xué)和統(tǒng)計(jì)的方法分析已有的數(shù)據(jù)。可是這個(gè)概念在商業(yè)上和學(xué)術(shù)上卻產(chǎn)生的天地一般的差別,在商業(yè)上,數(shù)據(jù)挖掘指的實(shí)際就是數(shù)據(jù)庫(kù)的整合和查詢,最多加上一些非常簡(jiǎn)單的算法,比如關(guān)聯(lián),就成了所謂的數(shù)據(jù)挖掘系統(tǒng),再者就干脆理解為OLAP和報(bào)表制作;而學(xué)術(shù)上呢?要是你翻開(kāi)Datamining的教科書(shū)或者論文集,你要擔(dān)心了,除非你是個(gè)數(shù)學(xué)系的畢業(yè)生,否則你絕對(duì)不會(huì)理解里面概念、公式和結(jié)論。為什么有這么大的差別呢?從軟件工程的角度來(lái)看,原來(lái)商人和學(xué)者的需求完全不同,商人不需要高深的理論,什么樣的工具對(duì)生意有用,對(duì)管理有用,就用什么工具,最好直觀可信易懂;但學(xué)者正好相反,要發(fā)表論文沒(méi)有創(chuàng)新不行,因此越來(lái)越多艱深的理論被寫(xiě)入論文。這樣造就了兩個(gè)截然不同的數(shù)據(jù)挖掘領(lǐng)域。
???其實(shí)要說(shuō)都不一樣也不確切,許多優(yōu)秀可行的分析方法在時(shí)間的考驗(yàn)中沉淀下來(lái),逐步進(jìn)入了商業(yè)領(lǐng)域,同時(shí)商業(yè)管理系統(tǒng)包括ERP,CRM也越來(lái)越注重新方法的應(yīng)用,看來(lái)商業(yè)和學(xué)術(shù)也不是兩條平行線。
???我們java人能做什么呢?看到許多領(lǐng)域:B/S、GIS、ERP、CAD乃至數(shù)據(jù)庫(kù)都有相應(yīng)的開(kāi)源軟件群了,而數(shù)據(jù)分析和挖掘卻一直很少人問(wèn)津,并不是它沒(méi)有用,而是DM要求的門(mén)檻較高,更需要耐心和恒心,因此希望越來(lái)越多的人關(guān)注開(kāi)源數(shù)據(jù)分析/挖掘的實(shí)現(xiàn)。
posted on 2007-01-02 16:06 Lieffert Liu 閱讀(794) 評(píng)論(2) 編輯 收藏