qileilove

          blog已經轉移至github,大家請訪問 http://qaseven.github.io/

          商業(yè)智能(BI,Business Intelligence)。

          商業(yè)智能(BI,Business Intelligence)。商業(yè)智能的概念最早在1996年提出。當時將商業(yè)智能定義為一類由數(shù)據(jù)倉庫(或數(shù)據(jù)集市)、查詢報表、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)備份和恢復等部分組成的、以幫助企業(yè)決策為目的技術及其應用。目前,商業(yè)智能通常被理解為將企業(yè)中現(xiàn)有的數(shù)據(jù)轉化為知識,幫助企業(yè)做出明智的業(yè)務經營決策的工具。商務智能系統(tǒng)中的數(shù)據(jù)來自企業(yè)其他業(yè)務系統(tǒng)。例如商貿型企業(yè),其商務智能系統(tǒng)數(shù)據(jù)包括業(yè)務系統(tǒng)的訂單、庫存、交易賬目、客戶和供應商信息等,以及企業(yè)所處行業(yè)和競爭對手的數(shù)據(jù)、其他外部環(huán)境數(shù)據(jù)。而這些數(shù)據(jù)可能來自企業(yè)的CRM、SCM等業(yè)務系統(tǒng)。
            商業(yè)智能能夠輔助的業(yè)務經營決策,既可以是操作層的,也可以是戰(zhàn)術層和戰(zhàn)略層的決策。為了將數(shù)據(jù)轉化為知識,需要利用數(shù)據(jù)倉庫聯(lián)機分析處理OLAP)工具和數(shù)據(jù)挖掘等技術。因此,從技術層面上講,商業(yè)智能不是什么新技術,它只是數(shù)據(jù)倉庫、OLAP和數(shù)據(jù)挖掘等技術的綜合運用。
            把商業(yè)智能看成一種解決方案應該比較恰當。商業(yè)智能的關鍵是從許多來自不同的企業(yè)運作系統(tǒng)的數(shù)據(jù)中提取出有用的數(shù)據(jù)并進行清理,以保證數(shù)據(jù)的正確性,然后經過抽取(Extraction)、轉換(Transformation)和裝載(Load),即ETL過程,合并到一個企業(yè)級的數(shù)據(jù)倉庫里,從而得到企業(yè)數(shù)據(jù)的一個全局視圖,在此基礎上利用合適的查詢和分析工具、數(shù)據(jù)挖掘工具、OLAP工具等對其進行分析和處理(這時信息變?yōu)檩o助決策的知識),最后將知識呈現(xiàn)給管理者,為管理者的決策過程提供支持。
            目前,商業(yè)智能產品及解決方案大致可分為數(shù)據(jù)倉庫產品、數(shù)據(jù)抽取產品、OLAP產品、展示產品、和集成以上幾種產品的針對某個應用的整體解決方案等。

          應具有的功能

            目前,很多廠商活躍在商業(yè)智能(下面簡稱BI)領域。事實上,能夠滿足用戶需要的BI產品和方案必須建立在穩(wěn)定、整合的平臺之上,該平臺需要提供用戶管理、安全性控制、連接數(shù)據(jù)源以及訪問、分析和共享信息的功能。BI平臺的標準化也非常重要,因為這關系到與企業(yè)多種應用系統(tǒng)的兼容問題,解決不了兼容問題,BI系統(tǒng)就不能發(fā)揮出應有效果。這里我們通過對一個實驗室的BI系統(tǒng)模型(我們將其稱為D系統(tǒng))進行功能解剖,來介紹BI系統(tǒng)。
            D系統(tǒng)是一個面向終端使用者,直接訪問業(yè)務數(shù)據(jù),能夠使管理者從各個角度出發(fā)分析利用商業(yè)數(shù)據(jù),及時地掌握組織的運營現(xiàn)狀,作出科學的經營決策的系統(tǒng)。D系統(tǒng)可實現(xiàn)從簡單的標準報表瀏覽到高級的數(shù)據(jù)分析,滿足組織內部人員的需求。D系統(tǒng)涵蓋了常規(guī)意義上商業(yè)智能(BI)系統(tǒng)的功能,主要構架包括以下幾個方面。
            讀取數(shù)據(jù)
            D系統(tǒng)可讀取多種格式(如Excel、Access、以Tab分割的txt和固定長的txt等)的文件,同時可讀取關系型數(shù)據(jù)庫 (對應ODBC)中的數(shù)據(jù)。在讀取文本和數(shù)據(jù)的基礎上,D系統(tǒng)還可以完成:
            連接文本 把2個CSV文件中的共同項目作為鍵(Key),將所需的數(shù)據(jù)合并到一個文件,這樣可以象操作數(shù)據(jù)庫一樣方便,但無須用戶編程即可實現(xiàn)。
            設置項目類型 作為數(shù)據(jù)的項目類型,除按鈕(button)(文字項目)、數(shù)值項目以外,還可以設置日期表示形式的日期數(shù)據(jù)項目、多媒體項目和不需要生成按鈕但在列表顯示中能夠瀏覽的參照項目。
            期間設置 日期項目數(shù)據(jù)可以根據(jù)年度或季度等組合后生成新??下午或時間帶等組合后生成新的時間項目。
            設置等級 對于數(shù)值項目,可以任意設置等級,生成與之相對應的按鈕。例如,可以生成與年齡項目中的20歲年齡段、30歲年齡段的等級相對應的按鈕。
            分析功能
            關聯(lián)/限定 關聯(lián)分析主要用于發(fā)現(xiàn)不同事件之間的關聯(lián)性,即一個事件發(fā)生的同時,另一個事件也經常發(fā)生。關聯(lián)分析的重點在于快速發(fā)現(xiàn)那些有實用價值的關聯(lián)發(fā)生的事件。其主要依據(jù)是,事件發(fā)生的概率和條件概率應該符合一定的統(tǒng)計意義。D系統(tǒng)把這種關聯(lián)的分析設計成按鈕的形式,通過選擇有/無關聯(lián),同時/相反的關聯(lián)。對于結構化的數(shù)據(jù),以客戶的購買習慣數(shù)據(jù)為例,利用D系統(tǒng)的關聯(lián)分析,可以發(fā)現(xiàn)客戶的關聯(lián)購買需要。例如,一個開設儲蓄賬戶的客戶很可能同時進行債券交易和股票交易。利用這種知識可以采取積極的營銷策略,擴展客戶購買的產品范圍,吸引更多的客戶。
            顯示數(shù)值比例/指示顯示順序 D系統(tǒng)可使數(shù)值項目的數(shù)據(jù)之間的比例關系通過按鈕的大小來呈現(xiàn),并顯示其構成比,還可以改變數(shù)值項目數(shù)據(jù)的排列順序等。選擇按鈕后,動態(tài)顯示不斷發(fā)生變化。這樣能夠獲得直觀的數(shù)據(jù)比較效果,并能夠凸顯差異,便于深入分析現(xiàn)象背后的本質。
            監(jiān)視功能 預先設置條件,使符合條件的按鈕顯示報警(紅)、注意(黃)信號,使問題所在一目了然。比如說:上季度營業(yè)額少于100萬元的店警告(黃色標出),少于50萬元的報警(紅色標出)。執(zhí)行后,D系統(tǒng)就把以店名命名的按鈕用相應的顏色表示出來。
            按鈕增值功能 可將多個按鈕組合,形成新的按鈕。比如:把【4月】、【5月】、【6月】三個按鈕組合后得到新的按鈕【第2季度】。
            記錄選擇功能 從大量數(shù)據(jù)中選擇按鈕,取出必要的數(shù)據(jù)。挑出來的數(shù)據(jù)可重新構成同樣的操作環(huán)境。這樣用戶可以把精力集中在所關心的數(shù)據(jù)上。
            多媒體情報表示功能 由數(shù)碼相機拍攝的照片或影像文件、通過掃描儀輸入的圖形等多媒體文件、文字處理或者電子表格軟件做成的報告書、HTML等標準形式保存的文件等,可以通過按鈕進行查找。
            分割按鈕功能 在分割特定按鈕類的情況下,只需切換被分割的個別按鈕,便可連接不斷實行已登錄過的定型處理。
            程序調用功能 把通過按鈕查找抽取出的數(shù)據(jù),傳給其他的軟件或用戶原有的程序,并執(zhí)行這些程序。
            查找按鈕名稱功能 通過按鈕名查找按鈕,可以指定精確和模糊兩種查找方法。另外,其他的按鈕類也可以對查找結果相關的數(shù)據(jù)進行限定。
            豐富的畫面
            列表畫面 可以用and/or改變查找條件,可以進行統(tǒng)計/排序。統(tǒng)計對象只針對數(shù)值項目,統(tǒng)計方法分三種:合計、件數(shù)、平均,而且可以按照12種方式改變數(shù)值的顯示格式。
            視圖畫面 提供切換視角和變換視圖功能,通過變換與設置條件相應的數(shù)值(單元格)的顏色表示強調。依次變換視角可進行多方面的數(shù)據(jù)分析。視圖的統(tǒng)計對象只針對數(shù)值項目,統(tǒng)計方法有合計、平均、構成比(縱向、橫向)、累計(縱向、橫向)、加權平均、最大、最小、最新和絕對值等12種。
            數(shù)值項目切換 通過按鈕類的階層化(行和列最多可分別設置8層),由整體到局部,一邊分層向下挖掘,一邊分析數(shù)據(jù),可以更加明確探討問題所在。
            圖表畫面 D系統(tǒng)使用自己開發(fā)的圖形庫,提供柱形圖、折線圖、餅圖、面積圖、柱形+折線五大類35種。在圖表畫面上,也可以像在階層視圖一樣,自由地對層次進行挖掘和返回等操作。
            數(shù)據(jù)輸出功能
            打印統(tǒng)計列表和圖表畫面等,可將統(tǒng)計分析好的數(shù)據(jù)輸出給其他的應用程序使用,或者以HTML格式保存。
            定型處理
            所需要的輸出被顯示出來時,進行定型登錄,可以自動生成定型處理按鈕。以后,只需按此按鈕,即使很復雜的操作,也都可以將所要的列表、視圖和圖表顯示出來。
            D系統(tǒng)應用范圍
            商業(yè)智能系統(tǒng)可輔助建立信息中心,如產生各種工作報表和分析報表。用作以下分析:
            銷售分析 主要分析各項銷售指標,例如毛利、毛利率、交叉比、銷進比、盈利能力、周轉率、同比、環(huán)比等等;而分析維又可從管理架構、類別品牌、日期、時段等角度觀察,這些分析維又采用多級鉆取,從而獲得相當透徹的分析思路;同時根據(jù)海量數(shù)據(jù)產生預測信息、報警信息等分析數(shù)據(jù);還可根據(jù)各種銷售指標產生新的透視表。
            商品分析 商品分析的主要數(shù)據(jù)來自銷售數(shù)據(jù)和商品基礎數(shù)據(jù),從而產生以分析結構為主線的分析思路。主要分析數(shù)據(jù)有商品的類別結構、品牌結構、價格結構、毛利結構、結算方式結構、產地結構等,從而產生商品廣度、商品深度、商品淘汰率、商品引進率、商品置換率、重點商品、暢銷商品、滯銷商品、季節(jié)商品等多種指標。通過D系統(tǒng)對這些指標的分析來指導企業(yè)商品結構的調整,加強所營商品的競爭能力和合理配置。
            人員分析 通過D系統(tǒng)對公司的人員指標進行分析,特別是對銷售人員指標(銷售指標為主,毛利指標??換、購銷商品數(shù)、代銷商品數(shù)、資金占用、資金周轉等)的分析,以達到考核員工業(yè)績,提高員工積極性,并為人力資源的合理利用提供科學依據(jù)。主要分析的主題有,員工的人員構成、銷售人員的人均銷售額、對于銷售的個人銷售業(yè)績、各管理架構的人均銷售額、毛利貢獻、采購人員分管商品的進貨多少、購銷代銷的比例、引進的商品銷量如何等等。

          定義為下列軟件工具的集合

            終端用戶查詢和報告工具。專門用來支持初級用戶的原始數(shù)據(jù)訪問,不包括適應于專業(yè)人士的成品報告生成工具。
            OLAP工具。提供多維數(shù)據(jù)管理環(huán)境,其典型的應用是對商業(yè)問題的建模與商業(yè)數(shù)據(jù)分析。OLAP也被稱為多維分析。
            數(shù)據(jù)挖掘(Data Mining)軟件。使用諸如神經網絡、規(guī)則歸納等技術,用來發(fā)現(xiàn)數(shù)據(jù)之間的關系,做出基于數(shù)據(jù)的推斷。
            數(shù)據(jù)倉庫(Data Warehouse)和數(shù)據(jù)集市(Data Mart)產品。包括數(shù)據(jù)轉換、管理和存取等方面的預配置軟件,通常還包括一些業(yè)務模型,如財務分析模型。
            聯(lián)機分析處理 (OLAP) 的概念最早是由關系數(shù)據(jù)庫之父E.F.Codd于1993年提出的,他同時提出了關于OLAP的12條準則。OLAP的提出引起了很大的反響,OLAP作為一類產品同聯(lián)機事務處理 (OLTP) 明顯區(qū)分開來。
            當今的數(shù)據(jù)處理大致可以分成兩大類:聯(lián)機事務處理OLTP(On-Line Transaction Processing)、聯(lián)機分析處理OLAP(On-Line Analytical Processing)。OLTP是傳統(tǒng)的關系型數(shù)據(jù)庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易。OLAP是數(shù)據(jù)倉庫系統(tǒng)的主要應用,支持復雜的分析操作,側重決策支持,并且提供直觀易懂的查詢結果。
            OLAP是使分析人員、管理人員或執(zhí)行人員能夠從多角度對信息進行快速、一致、交互地存取,從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術。OLAP的目標是滿足決策支持或者滿足在多維環(huán)境下特定的查詢和報表需求,它的技術核心是"維"這個概念。
            “維”是人們觀察客觀世界的角度,是一種高層次的類型劃分。“維”一般包含著層次關系,這種層次關系有時會相當復雜。通過把一個實體的多項重要的屬性定義為多個維(dimension),使用戶能對不同維上的數(shù)據(jù)進行比較。因此OLAP也可以說是多維數(shù)據(jù)分析工具的集合。
            OLAP的基本多維分析操作有鉆取(roll up和drill down)、切片(slice)和切塊(dice)、以及旋轉(pivot)、drill across、drill through等。
            鉆取是改變維的層次,變換分析的粒度。它包括向上鉆?。╮oll up)和向下鉆?。╠rill down)。roll up是在某一維上將低層次的細節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù),或者減少維數(shù);而drill down則相反,它從匯總數(shù)據(jù)深入到細節(jié)數(shù)據(jù)進行觀察或增加新維。
            切片和切塊是在一部分維上選定值后,關心度量數(shù)據(jù)在剩余維上的分布。如果剩余的維只有兩個,則是切片;如果有三個,則是切塊。 旋轉是變換維的方向,即在表格中重新安排維的放置(例如行列互換)。 OLAP有多種實現(xiàn)方法,根據(jù)存儲數(shù)據(jù)的方式不同可以分為ROLAP、MOLAP、HOLAP。
            ROLAP表示基于關系數(shù)據(jù)庫的OLAP實現(xiàn)(Relational OLAP)。以關系數(shù)據(jù)庫為核心,以關系型結構進行多維數(shù)據(jù)的表示和存儲。ROLAP將多維數(shù)據(jù)庫的多維結構劃分為兩類表:一類是事實表,用來存儲數(shù)據(jù)和維關鍵字;另一類是維表,即對每個維至少使用一個表來存放維的層次、成員類別等維的描述信息。維表和事實表通過主關鍵字和外關鍵字聯(lián)系在一起,形成了“星型模式”。對于層次復雜的維,為避免冗余數(shù)據(jù)占用過大的存儲空間,可以使用多個表來描述,這種星型模式的擴展稱為“雪花模式”。
            MOLAP表示基于多維數(shù)據(jù)組織的OLAP實現(xiàn)(Multidimensional OLAP)。以多維數(shù)據(jù)組織方式為核心,也就是說,MOLAP使用多維數(shù)組存儲數(shù)據(jù)。多維數(shù)據(jù)在存儲中將形成“立方塊(Cube)”的結構,在MOLAP中對“立方塊”的“旋轉”、“切塊”、“切片”是產生多維數(shù)據(jù)報表的主要技術。
            HOLAP表示基于混合數(shù)據(jù)組織的OLAP實現(xiàn)(?型的。這種方式具有更好的靈活性。
            還有其他的一些實現(xiàn)OLAP的方法,如提供一個專用的SQL Server,對某些存儲模式(如星型、雪片型)提供對SQL查詢的特殊支持。
            OLAP工具是針對特定問題的聯(lián)機數(shù)據(jù)訪問與分析。它通過多維的方式對數(shù)據(jù)進行分析、查詢和報表。維是人們觀察數(shù)據(jù)的特定角度。例如,一個企業(yè)在考慮產品的銷售情況時,通常從時間、地區(qū)和產品的不同角度來深入觀察產品的銷售情況。這里的時間、地區(qū)和產品就是維。而這些維的不同組合和所考察的度量指標構成的多維數(shù)組則是OLAP分析的基礎,可形式化表示為(維1,維2,……,維n,度量指標),如(地區(qū)、時間、產品、銷售額)。多維分析是指對以多維形式組織起來的數(shù)據(jù)采取切片(Slice)、切塊(Dice)、鉆?。―rill-down和Roll-up)、旋轉(Pivot)等各種分析動作,以求剖析數(shù)據(jù),使用戶能從多個角度、多側面地觀察數(shù)據(jù)庫中的數(shù)據(jù),從而深入理解包含在數(shù)據(jù)中的信息。
            主流的商業(yè)智能工具包括BO、COGNOS、BRIO。一些國內的軟件工具平臺如KCOM也集成了一些基本的商業(yè)智能工具。
            根據(jù)綜合性數(shù)據(jù)的組織方式的不同,目前常見的OLAP主要有基于多維數(shù)據(jù)庫的MOLAP及基于關系數(shù)據(jù)庫的ROLAP兩種。MOLAP是以多維的方式組織和存儲數(shù)據(jù),ROLAP則利用現(xiàn)有的關系數(shù)據(jù)庫技術來模擬多維數(shù)據(jù)。在數(shù)據(jù)倉庫應用中,OLAP應用一般是數(shù)據(jù)倉庫應用的前端工具,同時OLAP工具還可以同數(shù)據(jù)挖掘工具、統(tǒng)計分析工具配合使用,增強決策分析功能。

          三個層次

            經過幾年的積累,大部分中大型的企事業(yè)單位已經建立了比較完善的CRM、ERP、OA等基礎信息化系統(tǒng)。這些系統(tǒng)的統(tǒng)一特點都是:通過業(yè)務人員或者用戶的操作,最終對數(shù)據(jù)庫進行增加、修改、刪除等操作。上述系統(tǒng)可統(tǒng)一稱為OLTP(Online Transaction Process,在線事務處理),指的就是系統(tǒng)運行了一段時間以后,必然幫助企事業(yè)單位收集大量的歷史數(shù)據(jù)。但是,在數(shù)據(jù)庫中分散、獨立存在的大量數(shù)據(jù)對于業(yè)務人員來說,只是一些無法看懂的天書。業(yè)務人員所需要的是信息,是他們能夠看懂、理解并從中受益的抽象信息。此時,如何把數(shù)據(jù)轉化為信息,使得業(yè)務人員(包括管理者)能夠充分掌握、利用這些信息,并且輔助決策,就是商業(yè)智能主要解決的問題。 如何把數(shù)據(jù)庫中存在的數(shù)據(jù)轉變?yōu)闃I(yè)務人員需要的信息?大部分的答案是報表系統(tǒng)。簡單說,報表系統(tǒng)已經可以稱作是BI了,它是BI的低端實現(xiàn)。
            現(xiàn)在國外的企業(yè),大部分已經進入了中端BI,叫做數(shù)據(jù)分析。有一些企業(yè)已經開始進入高端BI,叫做數(shù)據(jù)挖掘。而我國的企業(yè),目前大部分還停留在報表階段。
            數(shù)據(jù)報表不可取代
            傳統(tǒng)的報表系統(tǒng)技術上已經相當成熟,大家熟悉的Excel、水晶報表、Reporting Service等都已經被廣泛使用。但是,隨著數(shù)據(jù)的增多,需求的提高,傳統(tǒng)報表系統(tǒng)面臨的挑戰(zhàn)也越來越多。
            1. 數(shù)據(jù)太多,信息太少
            密密麻麻的表格堆砌了大量數(shù)據(jù),到底有多少業(yè)務人員仔細看每一個數(shù)據(jù)?到底這些數(shù)據(jù)代表了什么信息、什么趨勢?級別越高的領導,越需要簡明的信息。如果我是董事長,我可能只需要一句話:目前我們的情況是好、中還是差?
            2. 難以交互分析、了解各種組合
            定制好的報表過于死板。例如,我們可以在一張表中列出不同地區(qū)、不同產品的銷量,另一張表中列出不同地區(qū)、不同年齡段顧客的銷量。但是,這兩張表無法回答諸如“華北地區(qū)中青年顧客購買數(shù)碼相機類型產品的情況”等問題。業(yè)務問題經常需要多個角度的交互分析。
            3. 難以挖掘出潛在的規(guī)則
            報表系統(tǒng)列出的往往是表面上的數(shù)據(jù)信息,但是海量數(shù)據(jù)深處潛在含有哪些規(guī)則呢?什么客戶對我們價值最大,產品之間相互關聯(lián)的程度如何?越是深層的規(guī)則,對于決策支持的價值越大,但是,也越難挖掘出來。
            4. 難以追溯歷史,數(shù)據(jù)形成孤島
            業(yè)務系統(tǒng)很多,數(shù)據(jù)存在于不同地方。太舊的數(shù)據(jù)(例如一年前的數(shù)據(jù))往往被業(yè)務系統(tǒng)備份出去,導致宏觀分析、長期歷史分析難度很大。
            因此,隨著時代的發(fā)展,傳統(tǒng)報表系統(tǒng)已經不能滿足日益增長的業(yè)務需求了,企業(yè)期待著新的技術。數(shù)據(jù)分析和數(shù)據(jù)挖掘的時代正在來臨。值得注意的是,數(shù)據(jù)分析和數(shù)據(jù)挖掘系統(tǒng)的目的是帶給我們更多的決策支持價值,并不是取代數(shù)據(jù)報表。報表系統(tǒng)依然有其不可取代的優(yōu)勢,并且將會長期與數(shù)據(jù)分析、挖掘系統(tǒng)一起并存下去。
            八維以上的數(shù)據(jù)分析
            如果說OLTP側重于對數(shù)據(jù)庫進行增加、修改、刪除等日常事務操作,OLAP(Online Analytics Process,在線分析系統(tǒng))則側重于針對宏觀問題,全面分析數(shù)據(jù),獲得有價值的信息。
            為了達到OLAP的目的,傳統(tǒng)的關系型數(shù)據(jù)庫已經不夠了,需要一種新的技術叫做多維數(shù)據(jù)庫。
            多維數(shù)據(jù)庫的概念并不復雜。舉一個例子,我們想描述2003年4月份可樂在北部地區(qū)銷售額10萬元時,牽扯到幾個角度:時間、產品、地區(qū)。這些叫做維度。至于銷售額,叫做度量值。當然,還有成本、利潤等。
            除了時間、產品和地區(qū),我們還可以有很多維度,例如客戶的性別、職業(yè)、銷售部門、促銷方式等等。實際上,使用中的多維數(shù)據(jù)庫可能是一個8維或者15維的立方體。
            雖然結構上15維的立方體很復雜,但是概念上非常簡單。
            數(shù)據(jù)分析系統(tǒng)的總體架構分為四個部分:源系統(tǒng)、數(shù)據(jù)倉庫、多維數(shù)據(jù)庫、客戶端。
            ·源系統(tǒng):包括現(xiàn)有的所有OLTP系統(tǒng),搭建BI系統(tǒng)并不需要更改現(xiàn)有系統(tǒng)。
            
            

          某案例中對銷售額的解析及當前產品的分類

          ·數(shù)據(jù)倉庫:數(shù)據(jù)大集中,通過數(shù)據(jù)抽取,把數(shù)據(jù)從源系統(tǒng)源源不斷地抽取出來,可能每天一次,或者每3個小時一次,當然是自動的。數(shù)據(jù)倉庫依然建立在關系型數(shù)據(jù)庫上,往往符合叫做“星型結構”的模型。
            ·多維數(shù)據(jù)庫:數(shù)據(jù)倉庫的數(shù)據(jù)經過多維建模,形成了立方體結構。每一個立方體描述了一個業(yè)務主題,例如銷售、庫存或者財務。
            ·客戶端:好的客戶端軟件可以把多維立方體中的信息豐富多彩地展現(xiàn)給用戶。
            數(shù)據(jù)分析案例:
            
            

          使用多維數(shù)據(jù)分析的案例

          在實際的案例中,我們利用Oracle 9i搭建了數(shù)據(jù)倉庫,Microsoft Analysis Service 2000搭建了多維數(shù)據(jù)庫,ProClarity 6.0 作為客戶端分析軟件。
            分解樹好像一個組織圖。分解樹在回答以下問題時很?最高的銷售額?
            ·在特定的產品種類內,各種產品間的銷售額分布如何?
            ·哪個銷售人員完成了最高百分比的銷售額?
            在圖1中,可以對PC機在各個地域的銷售額和所占百分比一目了然。任意一層分解樹都可以根據(jù)不同維度隨意展開。在該分解樹中,在大區(qū)這一層是按國家展開,在國家這一層是按產品分類展開。
            投影圖(圖3)使用散點圖的格式,顯示兩個或三個度量值之間的關系。數(shù)據(jù)點的集中預示兩個變量之間存在強的相關關系,而稀疏分布的數(shù)據(jù)點可能顯示不明顯的關系。
            投影圖很適合分析大量的數(shù)據(jù)。在顯示因果關系方面有明顯效果,比如例外的數(shù)據(jù)點就可以考慮進一步研究,因為它們落在“正常”的點群范圍之外。
            
            

          某案例的數(shù)據(jù)分析投影圖

          數(shù)據(jù)挖掘看穿你的需求
            廣義上說,任何從數(shù)據(jù)庫中挖掘信息的過程都叫做數(shù)據(jù)挖掘。從這點看來,數(shù)據(jù)挖掘就是BI。但從技術術語上說,數(shù)據(jù)挖掘(Data Mining)特指的是:源數(shù)據(jù)經過清洗和轉換等成為適合于挖掘的數(shù)據(jù)集。數(shù)據(jù)挖掘在這種具有固定形式的數(shù)據(jù)集上完成知識的提煉,最后以合適的知識模式用于進一步分析決策工作。從這種狹義的觀點上,我們可以定義:數(shù)據(jù)挖掘是從特定形式的數(shù)據(jù)集中提煉知識的過程。數(shù)據(jù)挖掘往往針對特定的數(shù)據(jù)、特定的問題,選擇一種或者多種挖掘算法,找到數(shù)據(jù)下面隱藏的規(guī)律,這些規(guī)律往往被用來預測、支持決策。

          發(fā)展趨勢

            與DSSEIS系統(tǒng)相比,商業(yè)智能具有更美好的發(fā)展前景。近些年來,商業(yè)智能市場持續(xù)增長。IDC預測,到2005年,BI市場將達到118億$,平均年增長率為27%(Information Access Tools Market Forecast and Analysis: 2001-2005, IDC#24779, June 2001)。隨著企業(yè)CRM、ERP、SCM等應用系統(tǒng)的引入,企業(yè)不停留在事務處理過程而注重有效利用企業(yè)的數(shù)據(jù)為準確和更快的決策提供支持的需求越來越強烈,由此帶動的對商業(yè)智能的需求將是巨大的。
            商業(yè)智能的發(fā)展趨勢可以歸納為以下幾點:
            功能上具有可配置性、靈活性、可變化性
            BI系統(tǒng)的范圍從為部門的特定用戶服務擴展到為整個企業(yè)所有用戶服務。同時,由于企業(yè)用戶在職權、需求上的差異,BI系統(tǒng)提供廣泛的、具有針對性的功能。從簡單的數(shù)據(jù)獲取,到利用WEB和局域網、廣域網進行豐富的交互、決策信息和知識的分析和使用。
            解決方案更開放、可擴展、可按用戶定制,在保證核心技術的同時,提供客戶化的界面
            針對不同企業(yè)的獨特的需求,BI系統(tǒng)在提供核心技術的同時,使系統(tǒng)又具個性化,即在原有方案基礎上加入自己的代碼和解決方案,增強客戶化的接口和擴展特性;可為企業(yè)提供基于商業(yè)智能平臺的定制/P>
            從單獨的商業(yè)智能向嵌入式商業(yè)智能發(fā)展
            這是目前商業(yè)智能應用的一大趨勢,即在企業(yè)現(xiàn)有的應用系統(tǒng)中,如財務、人力、銷售等系統(tǒng)中嵌入商業(yè)智能組件,使普遍意義上的事務處理系統(tǒng)具有商業(yè)智能的特性??紤]BI系統(tǒng)的某個組件而不是整個BI系統(tǒng)并非一件簡單的事,比如將OLAP技術應用到某一個應用系統(tǒng),一個相對完整的商業(yè)智能開發(fā)過程,如企業(yè)問題分析、方案設計、原型系統(tǒng)開發(fā)、系統(tǒng)應用等過程是不可缺少的。
            從傳統(tǒng)功能向增強型功能轉變
            增強型的商業(yè)智能功能是相對于早期的用SQL工具實現(xiàn)查詢的商業(yè)智能功能。目前應用中的BI系統(tǒng)除實現(xiàn)傳統(tǒng)的BI系統(tǒng)功能之外,大多數(shù)已實現(xiàn)了圖2中數(shù)據(jù)分析層的功能。而數(shù)據(jù)挖掘、企業(yè)建模是BI系統(tǒng)應該加強的應用,以更好地提高系統(tǒng)性能。

          posted on 2011-10-31 13:51 順其自然EVO 閱讀(376) 評論(0)  編輯  收藏 所屬分類: 數(shù)據(jù)庫

          <2011年10月>
          2526272829301
          2345678
          9101112131415
          16171819202122
          23242526272829
          303112345

          導航

          統(tǒng)計

          常用鏈接

          留言簿(55)

          隨筆分類

          隨筆檔案

          文章分類

          文章檔案

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 泌阳县| 潮安县| 临朐县| 阿拉善右旗| 军事| 应城市| 红安县| 定安县| 仲巴县| 禄劝| 惠水县| 额敏县| 澄江县| 炉霍县| 连平县| 泉州市| 宁河县| 北京市| 措美县| 广昌县| 镇沅| 保康县| 沧州市| 台湾省| 上高县| 察隅县| 济阳县| 仁寿县| 广灵县| 黄石市| 洛川县| 滁州市| 华蓥市| 台南市| 兰西县| 乐安县| 衡阳县| 芒康县| 察隅县| 雷山县| 清新县|