首頁新隨筆新文章聯(lián)系聚合

posts - 188,comments - 176,trackbacks - 0

2008年5月

>

日

一

二

三

四

五

六

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

常用鏈接

留言簿(13)

隨筆分類(188)

隨筆檔案(176)

強烈推薦

DBA Notes
JavaWorld
Java開源大全
OperaMasks.org
Oracle專欄
OSWorkflow
PL/SQL專欄
UML軟件工程組織
XZC.Log
中間件技術論壇
俺的大巴
咖啡小駐
堅持到底
大寶sodme
徽劍評點
韓小明

閱讀排行榜

評論排行榜

Oracle 的SQL*LOADER

Oracle 的SQL*LOADER可以將外部數(shù)據(jù)加載到數(shù)據(jù)庫表中。下面是SQL*LOADER的基本特點：

1.1 功能
1）能裝入不同數(shù)據(jù)類型文件及多個數(shù)據(jù)文件的數(shù)據(jù)
2）可裝入固定格式，自由定界以及可度長格式的數(shù)據(jù)
3）可以裝入二進制，壓縮十進制數(shù)據(jù)
4）一次可對多個表裝入數(shù)據(jù)
5）連接多個物理記錄裝到一個記錄中
6）對一單記錄分解再裝入到表中
7）可以用數(shù)對制定列生成唯一的KEY
8）可對磁盤或磁帶數(shù)據(jù)文件裝入制表中
9）提供裝入錯誤報告
10）可以將文件中的整型字符串，自動轉成壓縮十進制并裝入列表中。

1.2 控制文件
控制文件是用一種語言寫的文本文件，這個文本文件能被SQL*LOADER識別。
SQL*LOADER根據(jù)控制文件可以找到需要加載的數(shù)據(jù)。
并且分析和解釋這些數(shù)據(jù)。
控制文件由三個部分組成：

全局選件，行，跳過的記錄數(shù)等；
INFILE子句指定的輸入數(shù)據(jù)；
數(shù)據(jù)特性說明。

1.3 輸入文件
對于 SQL*Loader, 除控制文件外就是輸入數(shù)據(jù)。SQL*Loader可從一個或多個指定的文件中讀出數(shù)據(jù)。如果數(shù)據(jù)是在控制文件中指定，就要在控制文件中寫成 INFILE * 格式。當數(shù)據(jù)固定的格式（長度一樣）時且是在文件中得到時，要用INFILE <datafile_name> "fix n"

load data
infile 'example.dat' "fix 11"
into table example
fields terminated by ',' optionally enclosed by '"'
(col1 char(5),
col2 char(7))
example.dat:
001, cd, 0002,fghi,
00003,lmn,
1, "pqrs",
0005,uvwx,

當數(shù)據(jù)是可變格式（長度不一樣）時且是在文件中得到時，要用INFILE <datafile_name> "var n"。如：

load data
infile 'example.dat' "var 3"
into table example
fields terminated by ',' optionally enclosed by '"'
(col1 char(5),
col2 char(7))
example.dat:
009hello,cd,010world,im,
012my,name is,

1.4 壞文件
壞文件包含那些被SQL*Loader拒絕的記錄。被拒絕的記錄可能是不符合要求的記錄。
壞文件的名字由 SQL*Loader命令的BADFILE 參數(shù)來給定。

1.5 日志文件及日志信息
當SQL*Loader 開始執(zhí)行后，它就自動建立日志文件。日志文件包含有加載的總結，加載中的錯誤信息等。

[一]控制文件語法
控制文件的格式如下：

OPTIONS （ { [SKIP=integer] [ LOAD = integer ]
[ERRORS = integer] [ROWS=integer]
[BINDSIZE=integer] [SILENT=(ALL|FEEDBACK|ERROR|DISCARD) ] )
LOAD[DATA]
[ { INFILE | INDDN } {file | * }
[STREAM | RECORD | FIXED length [BLOCKSIZE size]|
VARIABLE [length] ]
[ { BADFILE | BADDN } file ]
{DISCARDS | DISCARDMAX} integr ]
[ {INDDN | INFILE} . . . ]
[ APPEND | REPLACE | INSERT ]
[RECLENT integer]
[ { CONCATENATE integer |
CONTINUEIF { [THIS | NEXT] (start[: end])LAST }
Operator { 'string' | X 'hex' } } ]
INTO TABLE [user.]table
[APPEND | REPLACE|INSERT]
[WHEN condition [AND condition]...]
[FIELDS [delimiter] ]
(
column {
RECNUM | CONSTANT value |
SEQUENCE ( { integer | MAX |COUNT} [, increment] ) |
[POSITION ( { start [end] | * [ + integer] }
) ]
datatype
[TERMINATED [ BY ] {WHITESPACE| [X] 'character' } ]
[ [OPTIONALLY] ENCLOSE [BY] [X]'charcter']
[NULLIF condition ]
[DEFAULTIF condotion]
}
[ ,...]
)
[INTO TABLE...]
[BEGINDATA]

1）要加載的數(shù)據(jù)文件：

1． INFILE 和INDDN是同義詞，它們后面都是要加載的數(shù)據(jù)文件。如果用 * 則表示數(shù)據(jù)就在控制文件內。在INFILE 后可以跟幾個文件。
2． STRAM 表示一次讀一個字節(jié)的數(shù)據(jù)。新行代表新物理記錄（邏輯記錄可由幾個物理記錄組成）。
3． RECORD 使用宿主操作系統(tǒng)文件及記錄管理系統(tǒng)。如果數(shù)據(jù)在控制文件中則使用這種方法。
4． FIXED length 要讀的記錄長度為length字節(jié)，
5． VARIABLE 被讀的記錄中前兩個字節(jié)包含的長度，length 記錄可能的長度。缺傷為8k字節(jié)。
6． BADFILE和BADDN同義。Oracle 不能加載數(shù)據(jù)到數(shù)據(jù)庫的那些記錄。
7． DISCARDFILE和DISCARDDN是同義詞。記錄沒有通過的數(shù)據(jù)。
8． DISCARDS和DISCARDMAX是同義詞。Integer 為最大放棄的文件個數(shù)。

2）加載的方法：

1．APPEND 給表添加行。
2．INSERT 給空表增加行（如果表中有記錄則退出）。
3．REPLACE 先清空表在加載數(shù)據(jù)。
4．RECLEN 用于兩種情況，1）SQLLDR不能自動計算記錄長度，2）或用戶想看壞文件的完整記錄時。對于后一種，Oracle只能按常規(guī)把壞記錄部分寫到錯誤的地方。如果看整條記錄，則可以將整條記錄寫到壞文件中。

3）指定最大的記錄長度：

1． CONCATENATE 允許用戶設定一個整數(shù)，表示要組合邏輯記錄的數(shù)目。

4）建立邏輯記錄：

1．THIS 檢查當前記錄條件，如果為真則連接下一個記錄。
2．NEXT 檢查下一個記錄條件。如果為真，則連接下一個記錄到當前記錄來。
3．Start: end 表示要檢查在THIS或NEXT字串是否存在繼續(xù)串的列，以確定是否進行連接。如：continueif next(1-3)='WAG' 或continueif next(1-3)=X'0d03if'

5）指定要加載的表：

1．INTO TABLE 要加的表名。
2．WHEN 和select WHERE類似。用來檢查記錄的情況，如：when(3-5)='SSM' and (22)='*"

6）介紹并括起記錄中的字段：

1． FIELDS 給出記錄中字段的分隔符，F(xiàn)IELDS格式為：

FIELDS [TERMIALED [BY] {WHITESPACE | [X] 'charcter'} ]
[ [ OPTIONALLY] ENCLOSE [BY] [X]'charcter' ]

TERMINATED 讀完前一個字段即開始讀下一個字段直到結束。
WHITESPACE 是指結束符是空格的意思。包括空格、Tab、換行符、換頁符及回車符。如果是要判斷單字符，可以用單引號括起，如X'1B'等。
OPTIONALLY ENCLOSED 表示數(shù)據(jù)應由特殊字符括起來。也可以括在TERMINATED字符內。使用OPTIONALLY要同時用TERMINLATED。
ENCLOSED 指兩個分界符內的數(shù)據(jù)。如果同時用 ENCLOSED和TERMINAED ，則它們的順序決定計算的順序。

7）定義列：

column   是表列名。列的取值可以是：
BECHUM   表示邏輯記錄數(shù)。第一個記錄為1,第2個記錄為2。
CONSTANT 表示賦予常數(shù)。
SEQUENCE        表示序列可以從任意序號開始，格式為：
SEQUENCE       （ { integer | MAX |COUNT} [,increment]
POSITION 給出列在邏輯記錄中的位置。可以是絕對的，或相對前一列的值。
格式為：
POSITION ( {start[end] | * [+integer] } )
Start 開始位置
* 表示前字段之后立刻開始。
+ 從前列開始向后條的位置數(shù)。

8）定義數(shù)據(jù)類型：
可以定義14種數(shù)據(jù)類型：
CHAR
DATE
DECIMAL EXTERNAL
DECIMAL
DOUBLE
FLOAT
FLOAT EXTERNAL
GRAPHIC EXTERNAL
INTEGER
INTEGER EXTERNAL
SMALLINT
VARCHAR
VARGRAPHIC

1．字符類型數(shù)據(jù)
CHAR [ (length)] [delimiter]
length缺省為 1.

2.日期類型數(shù)據(jù)
DATE [ ( length)]['date_format' [delimiter]
使用to_date函數(shù)來限制。

3．字符格式中的十進制
DECIMAL EXTERNAL [(length)] [delimiter]
用于常規(guī)格式的十進制數(shù)（不是二進制=> 一個位等于一個bit）。

4．壓縮十進制格式數(shù)據(jù)
DECIMAL （digtial [,precision]）

5．雙精度符點二進制
DOUBLE

6．普通符點二進制
FLOAT

7．字符格式符點數(shù)
FLOAT EXTERNAL [ (length) ] [delimiter]

8．雙字節(jié)字符串數(shù)據(jù)
GRAPHIC [ (legth)]

9．雙字節(jié)字符串數(shù)據(jù)
GRAPHIC EXTERNAL[ (legth)]

10．常規(guī)全字二進制整數(shù)
INTEGER

11．字符格式整數(shù)
INTEGER EXTERNAL

12．常規(guī)全字二進制數(shù)據(jù)
SMALLINT

13．可變長度字符串
VARCHAR

14．可變雙字節(jié)字符串數(shù)據(jù)
VARGRAPHIC

[二]寫控制文件CTL

1.1 數(shù)據(jù)文件的要求：數(shù)據(jù)類型的指定
      CHAR    字符型
      INTEGER EXTERNAL   整型
      DECIMAL EXTERNAL   浮點型

1．各數(shù)據(jù)文件的文件名;
2．各數(shù)據(jù)文件格式;
3．各數(shù)據(jù)文件里各數(shù)據(jù)記錄字段的屬性；
4．接受數(shù)據(jù)的ORACLE表列的屬性；
5．數(shù)據(jù)定義；
6．其它

2.1 數(shù)據(jù)文件的內容

可以在OS下的一個文件；或跟在控制文件下的具體數(shù)據(jù)。數(shù)據(jù)文件可以是：
1、二進制與字符格式：LOADER可以把二進制文件讀（當成字符讀）列表中
2、固定格式：記錄中的數(shù)據(jù)、數(shù)據(jù)類型、數(shù)據(jù)長度固定。
3、可變格式：每個記錄至少有一個可變長數(shù)據(jù)字段，一個記錄可以是一個連續(xù)的字符串。數(shù)據(jù)段的分界（如姓名、年齡）如用“，”作字段的分；用，"’作數(shù)據(jù)括號等
4、 LOADER可以使用多個連續(xù)字段的物理記錄組成一個邏輯記錄，記錄文件運行情況文件：包括以下內容：
1、運行日期：軟件版本號
2、全部輸入，輸出文件名；對命令行的展示信息，補充信息，
3、對每個裝入信息報告：如表名，裝入情況；對初始裝入，加截入或更新裝入的選擇情況，欄信息
4、數(shù)據(jù)錯誤報告：錯誤碼；放棄記錄報告
5、每個裝X報告：裝入行；裝入行數(shù)，可能跳過行數(shù)；可能拒絕行數(shù)；可能放棄行數(shù)等
6、統(tǒng)計概要：使用空間（包大小，長度）；讀入記錄數(shù)，裝入記錄數(shù)，跳過記錄數(shù)；拒絕記錄數(shù)，放棄記錄數(shù)；運行時間等。

[三]實際使用 SQL*Loader 工具
　　
　　我們可以用Oracle的sqlldr工具來導入數(shù)據(jù)。例如:
　　sqlldr scott/tiger control=loader.ctl
　　
　　控制文件(loader.ctl) 將加載一個外部數(shù)據(jù)文件（含分隔符). loader.ctl如下:
　　load data
　　infile 'c:\data\mydata.csv'
　　into table emp
　　fields terminated by "," optionally enclosed by '"'
　　( empno, empname, sal, deptno )
　　
　　mydata.csv 如下:
　　10001,"Scott Tiger", 1000, 40
　　10002,"Frank Naude", 500, 20
　　
　　下面是一個指定記錄長度的示例控制文件。"*" 代表數(shù)據(jù)文件與此文件同名，即在后面使用BEGINDATA段來標識數(shù)據(jù)。
　　load data
　　infile *
　　replace
　　into table departments
　　( dept position (02:05) char(4),
　　deptname position (08:27) char(20)
　　)
　　begindata
　　COSC COMPUTER SCIENCE
　　ENGL ENGLISH LITERATURE
　　MATH MATHEMATICS
　　POLY POLITICAL SCIENCE
　　Unloader這樣的工具
　　Oracle 沒有提供將數(shù)據(jù)導出到一個文件的工具。但是，我們可以用SQL*Plus的select 及 format 數(shù)據(jù)來輸出到一個文件：
　　set echo off newpage 0 space 0 pagesize 0 feed off head off trimspool on
　　spool oradata.txt
　　select col1 || ',' || col2 || ',' || col3
　　from tab1
　　where col2 = 'XYZ';
　　spool off
　　
　　另外，也可以使用使用 UTL_FILE PL/SQL 包處理:
　　rem Remember to update initSID.ora, utl_file_dir='c:\oradata' parameter
　　declare
　　fp utl_file.file_type;
　　begin
　　fp := utl_file.fopen('c:\oradata','tab1.txt','w');
　　utl_file.putf(fp, '%s, %s\n', 'TextField', 55);
　　utl_file.fclose(fp);
　　end;
　　/
　　
　　當然你也可以使用第三方工具，如SQLWays ,TOAD for Quest等。
　　
　　(1)加載可變長度或指定長度的記錄
　　
　　如：
　　LOAD DATA
　　INFILE *
　　INTO TABLE load_delimited_data
　　FIELDS TERMINATED BY "," OPTIONALLY ENCLOSED BY '"'
　　TRAILING NULLCOLS
　　( data1,
　　data2
　　)
　　BEGINDATA
　　11111,AAAAAAAAAA
　　22222,"A,B,C,D,"
　　
　　(2)下面是導入固定位置（固定長度）數(shù)據(jù)示例：
　　LOAD DATA
　　INFILE *
　　INTO TABLE load_positional_data
　　( data1 POSITION(1:5),
　　data2 POSITION(6:15)
　　)
　　BEGINDATA
　　11111AAAAAAAAAA
　　22222BBBBBBBBBB
　　
　　(3)跳過數(shù)據(jù)行：
　　
　　可以用 "SKIP n" 關鍵字來指定導入時可以跳過多少行數(shù)據(jù)。如：
　　LOAD DATA
　　INFILE *
　　INTO TABLE load_positional_data
　　SKIP 5
　　( data1 POSITION(1:5),
　　data2 POSITION(6:15)
　　)
　　BEGINDATA
　　11111AAAAAAAAAA
　　22222BBBBBBBBBB
　　
　　(4)導入數(shù)據(jù)時修改數(shù)據(jù)：
　　
　　在導入數(shù)據(jù)到數(shù)據(jù)庫時，可以修改數(shù)據(jù)。注意，這僅適合于常規(guī)導入，并不適合 direct導入方式.如：
　　LOAD DATA
　　INFILE *
　　INTO TABLE modified_data
　　( rec_no "my_db_sequence.nextval",
　　region CONSTANT '31',
　　time_loaded "to_char(SYSDATE, 'HH24:MI')",
　　data1 POSITION(1:5) ":data1/100",
　　data2 POSITION(6:15) "upper(:data2)",
　　data3 POSITION(16:22)"to_date(:data3, 'YYMMDD')"
　　)
　　BEGINDATA
　　11111AAAAAAAAAA991201
　　22222BBBBBBBBBB990112
　　
　　LOAD DATA
　　INFILE 'mail_orders.txt'
　　BADFILE 'bad_orders.txt'
　　APPEND
　　INTO TABLE mailing_list
　　FIELDS TERMINATED BY ","
　　( addr,
　　city,
　　state,
　　zipcode,
　　mailing_addr "decode(:mailing_addr, null, :addr, :mailing_addr)",
　　mailing_city "decode(:mailing_city, null, :city, :mailing_city)",
　　mailing_state
　　)
　　
　　(5)將數(shù)據(jù)導入多個表：
　　
　　如:
　　LOAD DATA
　　INFILE *
　　REPLACE
　　INTO TABLE emp
　　WHEN empno != ' '
　　( empno POSITION(1:4) INTEGER EXTERNAL,
　　ename POSITION(6:15) CHAR,
　　deptno POSITION(17:18) CHAR,
　　mgr POSITION(20:23) INTEGER EXTERNAL
　　)
　　INTO TABLE proj
　　WHEN projno != ' '
　　( projno POSITION(25:27) INTEGER EXTERNAL,
　　empno POSITION(1:4) INTEGER EXTERNAL
　　)
　　
　　(6)導入選定的記錄：
　　
　　如下例： (01) 代表第一個字符, (30:37) 代表30到37之間的字符:
　　LOAD DATA
　　INFILE 'mydata.dat' BADFILE 'mydata.bad' DISCARDFILE 'mydata.dis'
　　APPEND
　　INTO TABLE my_selective_table
　　WHEN (01) <> 'H' and (01) <> 'T' and (30:37) = '19991217'
　　(
　　region CONSTANT '31',
　　service_key POSITION(01:11) INTEGER EXTERNAL,
　　call_b_no POSITION(12:29) CHAR
　　)
　　
　　(7)導入時跳過某些字段：
　　
　　可用 POSTION(x:y) 來分隔數(shù)據(jù). 在Oracle8i中可以通過指定 FILLER　字段實現(xiàn)。FILLER 字段用來跳過、忽略導入數(shù)據(jù)文件中的字段.如：
　　LOAD DATA
　　TRUNCATE INTO TABLE T1
　　FIELDS TERMINATED BY ','
　　( field1,
　　field2 FILLER,
　　field3
　　)
　　
　　(8)導入多行記錄：
　　
　　可以使用下面兩個選項之一來實現(xiàn)將多行數(shù)據(jù)導入為一個記錄:
　　
　　CONCATENATE: - use when SQL*Loader should combine the same number of physical records together to form one logical record.
　　
　　CONTINUEIF - use if a condition indicates that multiple records should be treated as one. Eg. by having a '#' character in column 1.

        (9)去掉導入記錄的前后空格：
  create_customer_file2()
{
        echo "LOAD DATA
INFILE '$SQLLDR_DIR/$SQLLDR_DATA_DIR/$1'
INTO TABLE zxdbm_ismp.service
APPEND
FIELDS TERMINATED BY \"|\"
TRAILING NULLCOLS
(
serviceid \"trim(:serviceid)\",
SPID \"trim(:SPID)\",
AccessNo \"trim(:AccessNo)\",
ServiceType \"trim(:ServiceType)\"
)
" >$SQLLDR_DIR/$SQLLDR_CONTROL_DIR/$1.ctl
}
trim函數(shù)可以去掉文件每列的一前和一后的所有空格，當本列為空時，則導入也為空，當本列為一個或多個空格時，導入也為空。前提是表的該字段允許為NULL。

[四]SQL*Loader 數(shù)據(jù)的提交：
　　
　　1)一般情況下是在導入數(shù)據(jù)文件數(shù)據(jù)后提交的。
　　
　　2)也可以通過指定 ROWS= 參數(shù)來指定每次提交記錄數(shù)。
　　
　　提高 SQL*Loader 的性能：
　　
　　1) 一個簡單而容易忽略的問題是，沒有對導入的表使用任何索引和/或約束(主鍵)。如果這樣做，甚至在使用ROWS=參數(shù)時，會很明顯降低數(shù)據(jù)庫導入性能。
　　
　　2) 可以添加DIRECT=TRUE來提高導入數(shù)據(jù)的性能。當然，在很多情況下，不能使用此參數(shù)。
　　
　　3) 通過指定UNRECOVERABLE選項，可以關閉數(shù)據(jù)庫的日志。這個選項只能和direct一起使用。
　　
　　4) 可以同時運行多個導入任務.
　　
　　常規(guī)導入與direct導入方式的區(qū)別：
　　
　　常規(guī)導入可以通過使用 INSERT語句來導入數(shù)據(jù)。Direct導入可以跳過數(shù)據(jù)庫的相關邏(DIRECT=TRUE)，而直接將數(shù)據(jù)導入到數(shù)據(jù)文件中。

轉：http://hi.baidu.com/ggcong/blog/item/81986e4a610eb02308f7ef02.html

posted on 2008-05-08 10:41 cheng 閱讀(3683) 評論(0) 編輯收藏所屬分類: Oracle

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: Oracle數(shù)據(jù)庫常用的操作命令 Oracle的imp腳本 oracle 字符集的參數(shù)nls_lang SQLServer和Oracle常用函數(shù)對比各個數(shù)據(jù)庫的分頁算法 JDBC事務問題 PLSQL中顯式Cursor、隱式Cursor、動態(tài)Ref Cursor PLSQL開發(fā)筆記和小結 DBA在系統(tǒng)設計和開發(fā)中的工作范疇 Oracle 的SQL*LOADER