本站不再更新,歡迎光臨 java開發技術網
          隨筆-230  評論-230  文章-8  trackbacks-0

                  最近想學習BI,因為自己做的一個項目用到了大量Oracle 分析函數,而烴使用使用OLAP技術,系統目前數據量少,速度相對來說可以。每天數據量這么大,誰能保證積累了兩年的數據后,運算速度還有這么快呢。這讓我不得不思考我在做的項目與BI的差別,BI這概念之前只聽說過沒深入了解更沒有用過相應的工具。一開始自己就想到開源的BI工具,就開始下載,找入門文檔。兩天之后讓我發現這行不通,連概念都不理解,僅有工具是不行的。我們需要理解它的定義、歷史、作用,才能開始學習它,才需要用過工具。
          1、BI的定議:
                BI(Business Intelligence) 是一種運用了數據倉庫、在線分析和數據挖掘等技術來處理和分析數據的嶄新技術,目的是為企業決策者提供決策支持
               從定義上我們要明白BI運行的基礎是 :數據倉庫,和聯機分析 ,數據挖掘
               目的:提供決策支持
          2、BI分類
               信息類 BI 應用  
                  指由原始數據加工而來的數據查詢報表圖表多維分析數據可視化等應用,這些
          應用的共同特點是:將數據轉換為決策者可接受的信息,展現給決策者。例如將銀行交易數據加工為銀行財務報表。

               知識類 BI 應用

                指通過數據挖掘技術和工具,將數據中隱含的關系發掘出來,利用計算機直接將數據加工為知識,展現給決策者。
          3、BI的應用模式
               A、初級模式
                     數據查詢和生成報表,這是BI的初級應用模式
               B、
                    1、BI 高級應用模式
                     OLAP ,即聯機分析處理,是 BI 帶來的一種全新的數據觀察方式,是 BI 的核心技術 之一。
                   2、數據挖掘
                       數據挖掘的目的是通過計算機對大量數據進行分析,找出數據之間潛藏的規律和知識,并以可理解的方式展現給用戶。數據挖掘是最高級的 BI 應用,因為它能代替部分人腦功能。   
                   數據挖掘的三大要素是:

                   技術和算法:目前常用的數據挖掘技術包括——
                          自動類別偵測(Auto Cluster Detection)
                          決策樹(Decision Trees)
                          神經網絡(Neural Networks)

                  數據:由于數據挖掘是一個在已知中挖掘未知的過程,
                          因此需要大量數據的積累作為數據源,數據積累
                          量越大,數據挖掘工具就會有更多的參考點。

                  預測模型:也就是將需要進行數據挖掘的業務邏輯由
                          計算機模擬出來,這也是數據挖掘的主要任務。

          4、 底座——數據倉庫技術
                   數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrate)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的數據集合,用于支持管理決策。以上是數據倉庫的官方定義。 


          5、總結:
                要想學好BI,以上知識點是基礎。必須把基礎學習才能深切的理解BI,理解客戶在這主面真正意義上的需求。
               

          posted on 2008-04-17 12:55 有貓相伴的日子 閱讀(2514) 評論(3)  編輯  收藏 所屬分類: BI

          評論:
          # re: BI的入門 2008-04-21 00:02 | 歐陽
          國內沒有真正的數據挖掘。
          能夠做好 ETL和數據集市就很不錯了。。。
          現在國內比較強的BI公司在銀行和電信行業基本上是做ETL或者 ODS項目的。。。還有報表算一大塊。。。
          開源的BI不用太研究,國內不用那些。。。。
          IBM , ORACLE ,SAP 的 BI工具可以學習下。。。基本上國內大企業的BI都用這幾家的產品。。。開源的他們絕對不用  回復  更多評論
            
          # re: BI的入門 2008-04-22 10:32 | paladin
          @歐陽
          "國內沒有真正的數據挖掘"

          呵呵,只是你不知道呀,國內的企業是沒有,外企是有的

          不過都是剛剛起步的階段

          去了解了解吧,呵呵  回復  更多評論
            
          # re: BI的入門 2008-04-23 17:50 | 有貓相伴的日子
          國內所謂的BI,基本上是圖本分析加上olap的這種應用吧.....

          這些大企業不太喜歡開源的..  回復  更多評論
            

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          <2008年4月>
          303112345
          6789101112
          13141516171819
          20212223242526
          27282930123
          45678910

          常用鏈接

          留言簿(32)

          隨筆分類(222)

          隨筆檔案(224)

          文章分類(4)

          文章檔案(7)

          相冊

          收藏夾(4)

          最新評論

          閱讀排行榜

          評論排行榜

          本站不再更新,歡迎光臨 java開發技術網
          主站蜘蛛池模板: 都安| 双鸭山市| 兴义市| 同心县| 扎囊县| 揭西县| 灵丘县| 陵川县| 逊克县| 荣昌县| 奉贤区| 上林县| 清水河县| 阿尔山市| 绵阳市| 富民县| 呼和浩特市| 抚远县| 海南省| 沅陵县| 遂宁市| 曲阳县| 怀来县| 嘉义县| 宜兰县| 大理市| 峨眉山市| 岳阳县| 阿瓦提县| 德钦县| 罗源县| 西吉县| 湘潭县| 卢龙县| 香格里拉县| 恩平市| 开远市| 青州市| 佛山市| 东丽区| 五莲县|