自己選擇的路,摸爬滾打也要走下去

          【Oracle】極限挑戰—C#+ODP 100萬條數據導入Oracle數據庫僅用不到1秒

          作者: Aicken(李鳴)  來源: 博客園  發布時間: 2010-09-09 21:32  閱讀: 1021 次  原文鏈接   全屏閱讀  [收藏]  
          摘要:在這里我們將看到的是C#中利用ODP實現在Oracle數據庫中瞬間導入百萬級數據,這對快速批量導入的實現有重要意義。

              .Net程序中可以通過ODP調用特性,對Oracle數據庫進行操作,今天來講一下數據批量插入的功能,所用技術不高不深,相信很多朋友都接觸過,小弟班門弄斧了,呵呵。這篇文章是上篇文章的續集,因為上一次試驗的征集結果沒有突破4秒的方法,所以這次繼續挑戰與挖掘新方法,雖然是Oracle,但仍具有一定收藏意義。

              上一次文章中提及的試驗:

              極限挑戰—C#100萬條數據導入SQL SERVER數據庫僅用4秒 (附源碼)

              http://kb.cnblogs.com/page/73491/

              這個試驗是針對SQL SERVER數據庫的,宿主環境也是.Net,有興趣的朋友可以將這兩個試驗對比一下,為日后工作批量導數提供支持。

              另外,一些朋友對上次試驗環境有些異議,認為應該對數據庫和服務器做優化或設置,以體現試驗最終的時間結果。這個固然會影響試驗的時間結果,但考慮到在試驗環境中,對數據庫優化的標準與優化程度不便統一與定量,試驗結果也不易說明其影響源,所以這次試驗依然以標準數據庫建庫后的配置為主,試驗所在服務器硬件環境與上次試驗保持一致。實驗目的在于挖掘、對比宿主程序中的數據批量操作方法。

              有新方法提升性能時間指標的朋友,歡迎互相切磋,互相提高,嘴上功夫就免了。。。

              好了正文開始。

              ● 普通肉墊式

              什么叫批量插入呢,就是一次性插入一批數據,我們可以把這批數據理解為一個大的數組,而這些全部只通過一個SQL來實現,而在傳統方式下,需要調用很多次的SQL才可以完成,這就是著名的“數組綁定”的功能。我們先來看一下傳統方式下,插入多行記錄的操作方式:

          代碼
          //設置一個數據庫的連接串,

          string connectStr = "User Id=scott;Password=tiger;Data Source=";

          OracleConnection conn
          = new OracleConnection(connectStr);

          OracleCommand command
          = new OracleCommand();

          command.Connection
          = conn;

          conn.Open();

          Stopwatch sw
          = new Stopwatch();

          sw.Start();

          //通過循環寫入大量的數據,這種方法顯然是肉墊

          for (int i = 0; i < recc; i++)

          {

          string sql = "insert into dept values(" + i.ToString()

          + "," + i.ToString() + "," + i.ToString() + ")";

          command.CommandText
          = sql;

          command.ExecuteNonQuery();

          }

          sw.Stop();

          System.Diagnostics.Debug.WriteLine(
          "普通插入:" + recc.ToString()

          + "所占時間:" + sw.ElapsedMilliseconds.ToString());

              我們先準備好程序,但是先不做時間的測定,因為在后面我們會用多次循環的方式來計算所占用的時間。

              ● 使用ODP特性

              看上面的程序,大家都很熟悉,因為它沒有用到任何ODP的特性,而緊接著我們就要來介紹一個神奇的程序了,我們看一下代碼,為了更直觀,我把所有的注釋及說明直接寫在代碼里:

          代碼
          //設置一個數據庫的連接串

          string connectStr = "User Id=scott;Password=tiger;Data Source=";

          OracleConnection conn
          = new OracleConnection(connectStr);

          OracleCommand command
          = new OracleCommand();

          command.Connection
          = conn;

          //到此為止,還都是我們熟悉的代碼,下面就要開始嘍

          //這個參數需要指定每次批插入的記錄數

          command.ArrayBindCount
          = recc;

          //在這個命令行中,用到了參數,參數我們很熟悉,但是這個參數在傳值的時候

          //用到的是數組,而不是單個的值,這就是它獨特的地方

          command.CommandText
          = "insert into dept values(:deptno, :deptname, :loc)";

          conn.Open();

          //下面定義幾個數組,分別表示三個字段,數組的長度由參數直接給出

          int[] deptNo = new int[recc];

          string[] dname = new string[recc];

          string[] loc = new string[recc];

          // 為了傳遞參數,不可避免的要使用參數,下面會連續定義三個

          // 從名稱可以直接看出每個參數的含義,不在每個解釋了

          OracleParameter deptNoParam
          = new OracleParameter("deptno",

          OracleDbType.Int32);

          deptNoParam.Direction
          = ParameterDirection.Input;

          deptNoParam.Value
          = deptNo;

          command.Parameters.Add(deptNoParam);

          OracleParameter deptNameParam
          = new OracleParameter("deptname",

          OracleDbType.Varchar2);

          deptNameParam.Direction
          = ParameterDirection.Input;

          deptNameParam.Value
          = dname;

          command.Parameters.Add(deptNameParam);

          OracleParameter deptLocParam
          = new OracleParameter("loc",

          OracleDbType.Varchar2);

          deptLocParam.Direction
          = ParameterDirection.Input;

          deptLocParam.Value
          = loc;

          command.Parameters.Add(deptLocParam);

          Stopwatch sw
          = new Stopwatch();

          sw.Start();

          //在下面的循環中,先把數組定義好,而不是像上面那樣直接生成SQL

          for (int i = 0; i < recc; i++)

          {

          deptNo[i]
          = i;

          dname[i]
          = i.ToString();

          loc[i]
          = i.ToString();

          }

          //這個調用將把參數數組傳進SQL,同時寫入數據庫

          command.ExecuteNonQuery();

          sw.Stop();

          System.Diagnostics.Debug.WriteLine(
          "批量插入:" + recc.ToString()

          + "所占時間:" +sw.ElapsedMilliseconds.ToString());

              以上代碼略顯冗長,但是加上注釋后基本也就表達清楚了。

              好了,到目前為止,兩種方式的插入操作程序已經完成,就剩下對比了。我在主函數處寫了一個小函數,循環多次對兩個方法進行調用,并且同時記錄下時間,對比函數如下:

          for (int i = 1; i <= 50; i++)

          {

          Truncate();

          OrdinaryInsert(i
          * 1000);

          Truncate();

          BatchInsert(i
          * 1000);

          }
           

              當數據量達到100萬級別時,所用時間依然令人滿意,最快一次達到890毫秒,一般為1秒左右。

              經過試驗,得出一組數據,可以看出兩種方式在效率方面驚人的差距(占用時間的單位為毫秒),部分數據如下:

          記錄數

          標準

          批處理

          1000

          1545

          29

          2000

          3514

          20

          3000

          3749

          113

          4000

          5737

          40

          5000

          6820

          52

          6000

          9469

          72

          7000

          10226

          69

          8000

          15280

          123

          9000

          11475

          83

          10000

          14536

          121

          11000

          15705

          130

          12000

          16548

          145

          13000

          18765

          125

          14000

          20393

          116

          15000

          22181

          159

           
            因為篇幅原因,不再粘貼全部的數據,但是我們可以看一下由此數據生成的散點圖:

          clip_image002

              其中有些數據有些跳躍,可能和數據庫本身有關系,但是大部分數據已經能說明問題了??戳诉@些數據后,是不是有些心動了?

              源程序放了一段時間直接拷貝貼過來了,可能需要調試一下才能跑通,不過不是本質性問題,對了如果要測試別忘記安裝Oracle訪問組件。



          一天,一個月,一年??傆幸惶鞎兊貌灰粯?。

          posted on 2011-08-26 14:48 wokaoJune 閱讀(887) 評論(0)  編輯  收藏 所屬分類: Oracle

          <2011年8月>
          31123456
          78910111213
          14151617181920
          21222324252627
          28293031123
          45678910

          導航

          統計

          公告

          GO ,GO,GO
          自己選擇的路,摸爬滾打也要走下去

          常用鏈接

          留言簿

          隨筆分類(26)

          隨筆檔案(29)

          文章分類

          最新隨筆

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 茶陵县| 清水河县| 肥城市| 镇安县| 朝阳区| 伊春市| 渝北区| 永康市| 广昌县| 临武县| 江华| 花莲县| 邵阳县| 合江县| 湘潭县| 济宁市| 姜堰市| 时尚| 上杭县| 浮山县| 历史| 呈贡县| 光泽县| 皮山县| 甘肃省| 石城县| 白朗县| 江都市| 永平县| 怀仁县| 牟定县| 曲周县| 东台市| 乐至县| 天峻县| 延庆县| 阿拉善左旗| 绥阳县| 邮箱| 西藏| 枣庄市|