No pains, No gain
          走過、路過、千萬別錯過
          posts - 23,comments - 1,trackbacks - 0

          理解ORACLE數據庫字符集

          一.引言

          ??? ORACLE數據庫字符集,即Oracle全球化支持(Globalization Support),或即國家語言支持(NLS)其作用是用本國語言和格式來存儲、處理和檢索數據。利用全球化支持,ORACLE為用戶提供自己熟悉的數據庫母語環境,諸如日期格式、數字格式和存儲序列等。Oracle可以支持多種語言及字符集,其中oracle8i支持48種語言、76個國家地域、229種字符集,而oracle9i則支持57種語言、88個國家地域、235種字符集。由于oracle字符集種類多,且在存儲、檢索、遷移oracle數據時多個環節與字符集的設置密切相關,因此在實際的應用中,數據庫開發和管理人員經常會遇到有關oracle字符集方面的問題。本文通過以下幾個方面闡述,對oracle字符集做簡要分析

          二.字符集基本知識

          2.1字符集
          ??? 實質就是按照一定的字符編碼方案,對一組特定的符號,分別賦予不同數值編碼的集合。Oracle數據庫最早支持的編碼方案是US7ASCII
          ??? Oracle
          的字符集命名遵循以下命名規則 :
          ???
          ???
          :? <語言><比特位數><編碼
          >
          ???
          比如: ZHS16GBK表示采用GBK編碼格式、16位(兩個字節)簡體中文字符集

          2.2字符編碼方案
          2.2.1 單字節編碼
          ???
          1)單字節7位字符集,可以定義128個字符,最常用的字符集為 US7ASCII
          ???
          2)單字節8位字符集,可以定義256個字符,適合于歐洲大部分國家

          ???
          例如:WE8ISO8859P1(西歐、8位、ISO標準8859P1編碼 )
          2.2.2
          多字節編碼

          ???
          1)變長多字節編碼
          ????
          某些字符用一個字節表示,其它字符用兩個或多個字符表示,變長多字節編碼常用于對亞洲語言的支持,?? 例如日語、漢語、印地語等
          ???
          例如:AL32UTF8(其中AL代表ALL,指適用于所有語言)、 zhs16cgb231280
          ???
          2)定長多字節編碼

          ???
          每一個字符都使用固定長度字節的編碼方案,目前oracle唯一支持的定長多字節編碼是AF16UTF16,也是僅用于國家字符集
          2.2.3 unicode
          編碼
          ??? Unicode
          是一個涵蓋了目前全世界使用的所有已知字符的單一編碼方案,也就是說Unicode為每一個字符提供唯一的編碼。UTF-16unicode16位編碼方式,是一種定長多字節編碼,用2個字節表示一個unicode字符,AF16UTF16UTF-16編碼字符集。
          ??? UTF-8
          unicode8位編碼方式,是一種變長多字節編碼,這種編碼可以用123個字節表示一個unicode字符,AL32UTF8UTF8UTFEUTF-8編碼字符集

          2.3 字符集超級
          ??? 當一種字符集(字符集A)的編碼數值包含所有另一種字符集(字符集B)的編碼數值,并且兩種字符集相同編碼數值代表相同的字符時,則字符集A是字符集B的超級,或稱字符集B是字符集A的子集。
          ??? Oracle8i
          oracle9i官方文檔資料中備有子集-超級對照表(subset-superset pairs),例如:WE8ISO8859P1WE8MSWIN1252的子集。由于US7ASCII是最早的Oracle數據庫編碼格式,因此有許多字符集是US7ASCII的超集,例如WE8ISO8859P1ZHS16CGB231280ZHS16GBK都是US7ASCII的超集。

          2.4 數據庫字符集(oracle服務器端字符集)
          ??? 數據庫字符集在創建數據庫時指定,在創建后通常不能更改。在創建數據庫時,可以指定字符集(CHARACTER SET)和國家字符集(NATIONAL CHARACTER SET)
          2.4.1
          字符集
          ??? (1)
          用來存儲CHAR, VARCHAR2, CLOB, LONG等類型數據
          ??? (2)
          用來標示諸如表名、列名以及PL/SQL變量等
          ??? (3)
          用來存儲SQLPL/SQL程序單元等
          2.4.2
          國家字符集:
          ??? (1)
          用以存儲NCHAR, NVARCHAR2, NCLOB等類型數據
          ??? (2)
          國家字符集實質上是為oracle選擇的附加字符集,主要作用是為了增強oracle的字符處理能力,因為NCHAR數據類型可以提供對亞洲使用定長多字節編碼的支持,而數據庫字符集則不能。國家字符集在oracle9i中進行了重新定義,只能在unicode編碼中的AF16UTF16UTF8中選擇,默認值是 AF16UTF16
          2.4.3
          查詢字符集參數

          ???
          可以查詢以下數據字典或視圖查看字符集設置情況
          ??? nls_database_parameters
          props$ v$nls_parameters
          ???
          查詢結果中NLS_CHARACTERSET表示字符集,NLS_NCHAR_CHARACTERSET表示國家字符集

          2.4.4
          修改數據庫字符集
          ???
          按照上文所說,數據庫字符集在創建后原則上不能更改。如果需要修改字符集,通常需要導出數據庫數據,重建數據庫,再導入數據庫數據的方式來轉換,或通過ALTER DATABASE CHARACTER SET語句修改字符集,但創建數據庫后修改字符集是有限制的,只有新的字符集是當前字符集的超集時才能修改數據庫字符集,例如UTF8US7ASCII的超集,修改數據庫字符集可使用ALTER DATABASE CHARACTER SET UTF8

          2.5 客戶端字符集(NLS_LANG參數)
          2.5.1
          客戶端字符集含義
          ???
          客戶端字符集定義了客戶端字符數據的編碼方式,任何發自或發往客戶端的字符數據均使用客戶端定義的字符集編碼,客戶端可以看作是能與數據庫直接連接的各種應用,例如sqlplus,exp/imp等。客戶端字符集是通過設置NLS_LANG參數來設定的。
          2.5.2 NLS_LANG
          參數格式
          ??? NLS_LANG=_.
          ??? Language:
          顯示oracle消息,校驗,日期命名
          ??? Territory
          :指定默認日期、數字、貨幣等格式
          ??? Client character set
          :指定客戶端將使用的字符集
          ???
          例如: NLS_LANG=AMERICAN_AMERICA.US7ASCII?
          ??? AMERICAN
          是語言,AMERICA是地區,US7ASCII是客戶端字符集

          2.5.3
          客戶端字符集設置方法
          ???? 1)UNIX
          環境
          ???????? $NLS_LANG=“simplified chinese”_china.zhs16gbk
          ???????? $export NLS_LANG
          ????????
          編輯oracle用戶的profile文件
          ??? 2)Windows
          環境
          ????????
          編輯注冊表
          ???????? Regedit.exe---HKEY_LOCAL_MACHINE---SOFTWARE---ORACLE—HOME0
          2.5.4 NLS
          參數查詢
          ??? Oracle
          提供若干NLS參數定制數據庫和用戶機以適應本地格式,例如有NLS_LANGUAGE,NLS_DATE_FORMAT,NLS_CALENDER等,可以通過查詢以下數據字典或v$視圖查看。
          ??? NLS_DATABASE_PARAMETERS--
          顯示數據庫當前NLS參數取值,包括數據庫字符集取值
          ??? NLS_SESSION_PARAMETERS--
          顯示由NLS_LANG 設置的參數,或經過alter session 改變后的參數值(不包括由NLS_LANG 設置的客戶端字符集)
          ??? NLS_INSTANCE_PARAMETE--
          顯示由參數文件init.ora 定義的參數V$NLS_PARAMETERS--顯示數據庫當前NLS參數取值
          2.5.5
          修改NLS參數
          ???
          使用下列方法可以修改NLS參數
          ???
          1)修改實例啟動時使用的初始化參數文件
          ???
          2)修改環境變量 NLS_LANG
          ???
          3)使用ALTER SESSION語句,在oracle會話中修改

          ???
          4)使用某些SQL函數
          ??? NLS
          作用優先級別:Sql function>alter session>環境變量或注冊表>參數文件>數據庫默認參數

          三.導入/導出與字符集轉換

          3.1 EXP/IMP
          ??? Export Import 是一對讀寫Oracle數據的工具。Export Oracle 數據庫中的數據輸出到操作系統文件中, Import 把這些文件中的數據讀到Oracle 數據庫中,由于使用exp/imp進行數據遷移時,數據從源數據庫到目標數據庫的過程中有四個環節涉及到字符集,如果這四個環節的字符集不一致,將會發生字符集轉換。

          EXP
          ???? ____________? ?_________________? _____________
          ???? |imp導入文件|<-><->
          ?????------------?? -----------------??-------------

          IMP?
          ???? ____________? ?_________________? _____________
          ???? |imp導入文件|->|環境變量NLS_LANG|->|數據庫字符集|
          ?????------------?? -----------------??-------------

          ??? 四個字符集是
          ??
          1)源數據庫字符集
          ??
          2Export過程中用戶會話字符集(通過NLS_LANG設定)
          ??
          3Import過程中用戶會話字符集(通過NLS_LANG設定)
          ??
          4)目標數據庫字符集

          3.2導出的轉換過程
          ??? Export過程中,如果源數據庫字符集與Export用戶會話字符集不一致,會發生字符集轉換,并在導出文件的頭部幾個字節中存儲Export用戶會話字符集的ID號。在這個轉換過程中可能發生數據的丟失。
          :如果源數據庫使用ZHS16GBK,而Export用戶會話字符集使用US7ASCII,由于ZHS16GBK16位字符集,US7ASCII7位字符集,這個轉換過程中,中文字符在US7ASCII中不能夠找到對等的字符,所以所有中文字符都會丟失而變成“?? ”形式,這樣轉換后生成的Dmp文件已經發生了數據丟失。
          因此如果想正確導出源數據庫數據,則Export過程中用戶會話字符集應等于源數據庫字符集或是源數據庫字符集的超集

          3.3導入的轉換過程
          ???
          1)確定導出數據庫字符集環境
          ???
          通過讀取導出文件頭,可以獲得導出文件的字符集設置
          ???
          2)確定導入session的字符集,即導入Session使用的NLS_LANG環境變量
          ???
          3IMP讀取導出文件
          ???
          讀取導出文件字符集ID,和導入進程的NLS_LANG進行比較
          ???
          4)如果導出文件字符集和導入Session字符集相同,那么在這一步驟內就不需要轉換,如果不同,就需要把數據轉換為導入Session使用的字符集。可以看出,導入數據到數據庫過程中發生兩次字符集轉換
          ???
          第一次:導入文件字符集與導入Session使用的字符集之間的轉換,如果這個轉換過程不能正確完成,Import向目標數據庫的導入過程也就不能完成。
          ???
          第二次:導入Session字符集與數據庫字符集之間的轉換。
          ???
          然而,oracle8i的這種轉換只能在單字節字符集之間進行,oracle8i導入Session不支持多字節字符集之間的轉換,因此為了避免第一次轉換,導入Session使用的NLS_LANG與導出文件字符集相同,第二次轉換(通過SQL*Net)支持任何兩種字符集。以上情況在Oracle9i中略有不同

          四.亂碼問題

          ??? oracle在數據存儲、遷移過程中經常發生字符亂碼問題,歸根到底是由于字符集使用不當引起。下面以使用客戶端sqlplus向數據庫插入數據和導入/導出(EXP/IMP)過程為例,說明亂碼產生的原因。

          4.1使用客戶端sqlplus向數據庫存儲數據
          ???
          這個過程存在3個字符集設置
          ???
          1)客戶端應用字符集
          ???
          2)客戶端NLS_LANG參數設置
          ???
          3)服務器端數據庫字符集(Character Set)設置
          ???
          客戶端應用sqlplus中能夠顯示什么樣的字符取決于客戶端操作系統語言環境(客戶端應用字符集),但在應用中錄入這些字符后,這些字符能否在數據庫中正常存儲,還與另外兩個字符集設置緊密相關,其中客戶端NLS_LANG參數主要用于字符數據傳輸過程中的轉換判斷。常見的亂碼大致有兩種情形:
          ???
          1)漢字變成問號
          當從字符集A 轉換成字符集B時,如果轉換字符之間不存在對應關系,NLS_LANG使用替代字符替代無法映射的字符
          ???
          2)漢字變成未知字符(雖然有些是漢字,但與原字符含義不同)
          轉換存在對應關系,但字符集A 中的字符編碼與字符集B 中的字符編碼代表不同含義

          4.2發生亂碼原因 ?
          ?? ?
          亂碼產生是由于幾個字符集之間轉換不匹配造成,分以下幾種情況:

          ???
          (注:字符集之間如果不存在子集、超集對應關系時的情況不予考慮,因為這種情況下字符集之間轉換必產生亂碼) ???
          ??? 1
          )服務器端數據庫字符集與客戶端應用字符集相同,與客戶端NLS_LANG參數設置不同

          ???
          如果客戶端NLS_LANG字符集是其它兩種字符集的子集,轉換過程將出現亂碼。
          ???
          解決方法:將三種字符集設置成同一字符集,或NLS_LANG字符集是其它兩種字符集的超集
          ??? 2
          )服務器端數據庫字符集與客戶端NLS_LANG參數設置相同,與客戶端應用字符集不同
          ???
          如果客戶端應用字符集是其它兩種字符集的超集時,轉換過程將出現亂碼,但對于單字節編碼存儲中文問題,可參看本文第5章節的分析
          ??? 3
          )客戶端應用字符集、客戶端NLS_LANG參數設置、服務器端數據庫字符集互不相同
          ?? ?
          此種情況較為復雜,但三種字符集之間只要有不能轉換的字符,則必產生亂碼

          4.3導入/導出過程出現亂碼原因
          ???
          這個過程存在4個字符集設置,在3.1章節中已分析
          ??
          1)源數據庫字符集
          ??
          2EXP過程中NLS_LANG參數
          ??
          3IMP過程中NLS_LANG參數
          ??
          4)目標數據庫字符集
          ???
          出現亂碼原因
          ??? 1
          )當源數據庫字符集不等于EXP過程中NLS_LANG參數,且源數據庫字符集是EXP過程中NLS_LANG的子集,才能保證導出文件正確,其他情況則導出文件字符亂碼
          ??? 2
          EXP過程中NLS_LANG字符集不等于IMP過程中NLS_LANG字符集,且EXP過程中NLS_LANG字符集是IMP過程中NLS_LANG字符集的子級, 才能保證第一次轉換正常,否則第一次轉換中出現亂碼。
          ??? 3
          )如果第一次轉換正常,IMP過程中NLS_LANG字符集是目標數據庫字符集的子集或相同,才能保證第二次轉換正常,否則則第二次轉換中出現亂碼

          五.單字節編碼存儲中文問題

          ??? 由于歷史的原因,早期的oracle沒有中文字符集(如oracle6oracle7oracle7.1,但有的用戶從那時起就使用數據庫了,并用US7ASCII字符集存儲了中文,或是有的用戶在創建數據庫時,不考慮清楚,隨意選擇一個默認的字符集,如WE8ISO8859P1US7ASCII,而這兩個字符集都沒有漢字編碼,雖然有些時候選用這種字符集好象也能正常使用,但用這種字符集存儲漢字信息從原則上說就是錯誤的,它會給數據庫的使用與維護帶來一系列的麻煩。
          ???
          正常情況下,要將漢字存入數據庫,數據庫字符集必須支持中文,而將數據庫字符集設置為US7ASCII等單字節字符集是不合適的。US7ASCII字符集只定義了128個符號,并不支持漢字。另外,如果在SQL*PLUS中能夠輸入中文,操作系統缺省應該是支持中文的,但如果在NLS_LANG中的字符集設置為US7ASCII,顯然也是不正確的,它沒有反映客戶端的實際情況。但在實際應用中漢字顯示卻是正確的,這主要是因為Oracle檢查數據庫與客戶端的字符集設置是同樣的,那么數據在客戶與數據庫之間的存取過程中將不發生任何轉換,但是這實際上導致了數據庫標識的字符集與實際存入的內容是不相符的。而在SELECT的過程中,Oracle同樣檢查發現數據庫與客戶端的字符集設置是相同的,所以它也將存入的內容原封不動地傳送到客戶端,而客戶端操作系統識別出這是漢字編碼所以能夠正確顯示。
          ???
          在這個例子中,數據庫與客戶端都沒有設置成中文字符集,但卻能正常顯示中文,從應用的角度看好象沒問題。然而這里面卻存在著極大的隱患,比如在應用lengthsubstr等字符串函數時,就可能得到意外的結果。
          ???
          對于早期使用US7ASCII字符集數據庫的數據遷移到oracle8i/9i中(使用zhs16gbk),由于原始數據已經按照US7ASCII格式存儲,對于這種情況,可以通過使用Oracle8i的導出工具,設置導出字符集為US7ASCII,導出后使用UltraEdit等工具打開dmp文件,修改第二、三字符,修改 0001 0354,這樣就可以將US7ASCII字符集的數據正確導入到ZHS16GBK的數據庫中。

          六.結束語

          ??? 為了避免在數據庫遷移過程中由于字符集不同導致的數據損失,oracle提供了字符集掃描工具(character set scanner),通過這個工具我們可以測試在數據遷移過程中由于字符集轉換可能帶來的問題,然后根據測試結果,確定數據遷移過程中最佳字符集解決方案。


          參考文獻
          [1]Biju Thomas , Bob Bryla
          oracle9i DBA基礎I 學習指南》電子工業出版社 2002

          posted @ 2007-02-13 13:12 一縷青煙 閱讀(218) | 評論 (0)編輯 收藏

          表格部分代碼如下:

          <table id="testTbl" border=1>

          <tr id="tr1">

          <td width=6%><input type=checkbox id="box1"></td>

          <td id="b">第一行</td>

          </tr>

          <tr id="tr2">

          <td width=6%><input type=checkbox id="box2"></td>

          <td id="b">第二行</td>

          </tr>

          <tr>

          <td width=6%><input type=checkbox id="box3"></td>

          <td>第三行</td>

          </tr>

          </table>

          動態添加表行的javascript函數如下:

          <script language="javascript">

          function addRow(){

          //添加一行

          var newTr = testTbl.insertRow();

          //設置行背景

          newTr.bgColor = '#008040';

          //添加兩列

          var newTd0 = newTr.insertCell();

          var newTd1 = newTr.insertCell();

          //設置列內容和屬性

          newTd0.innerHTML = '<input type=checkbox id="box4">';

          newTd1.innerText= '新增加的行';
          }
          </script>

          <BR>
          <a href="#" onclick="addRow();">增加一行</a>


          就這么簡單,做點詳細的說明:

          1、inserRow()和insertCell()函數

          insertRow()函數可以帶參數,形式如下:

          insertRow(index)

          這個函數將新行添加到index的那一行前,比如insertRow(0),是將新行添加到第一行之前。默認的insertRow()函數相當于insertRow(-1),將新行添加到表的最后。

          insertCell()和insertRow的用法相同。

          2、動態設置屬性和事件

          上面行數中的innerHTML和innerText都是列的屬性。

          這個inner,就是“inner”到<tb></tb>之間,innerText是添加到<tb></tb>之間的文本,innerHTML是添加到<tb></tb>之間的HTML代碼(這個so簡單,這個解釋挺多余的)

          設置其他屬性也是用同樣的方式,比如,設置行背景色

          newTr.bgColor = 'red';

          ?

          設置事件也一樣,需要簡單說明一點。

          比如,我要讓點擊新加行的時候執行一個自己定義的函數 newClick,newClick行數如下:

          function newClick(){

          alert("這是新添加的行");

          對onclick事件設置這個函數的代碼如下:

          newTr.onclick = newClick;

          這里需要主義的是,=后面的部分必須是函數名,而且不能帶引號,

          newTr.onclick = newClick();

          newTr.onclick = 'newClick';

          newTr.onclick = "newClick";

          上面的寫法都是錯誤的。

          為什么,其實知道為什么沒有什么意思,知道怎么用就OK了,如果不想知道,可以跳過下面這一段。

          ?

          實際上這個=后面的newClick是指向自己定義的newClick函數的指針,javascript里面函數名就是指向函數的指針,加了引號括號什么的瀏覽器就找不到那個函數了。

          下面的寫法,也是正確的

          newTr.onclick = function newClick(){

          alert("這是新添加的行");

          這個使用函數名實際上是一樣的

          設置其他的事件用法相同。

          posted @ 2007-01-18 14:39 一縷青煙 閱讀(1818) | 評論 (0)編輯 收藏
          J2EE程序中使用oracle數據庫LOB字段的總結(elathen)
          ???http://www.souzz.net 2005-10-23 文章出處:博客園
          ?
          ????

          posted on 2005-05-27 09:36 輕松逍遙子

          最近在J2EE的項目中需要使用LOB字段保存文本信息以及圖片和文件,到網上搜拉一下,還不少,仔細看拉一下,但都不是很全有的還有錯誤,經過幾天的實踐,把問題都解決拉,順便總結一下,希望對需要的朋友有點參考

          LOB中我們用的比較多的主要有兩種CLOB和BLOB,我們對兩種類型分別討論

          1.CLOB是字符型LOB,主要存儲文本信息,,最長為4G.,在J2EE程序中,比如網頁的textarea中的字符信息比較長,Varchar2字段類型不能滿足時,我們就得用CLOB數據類型,我們這次項目中就碰到這種情況.現在我們先說說如何存取CLOB字段

          現在我要把網頁中的textarea元素的信息保存到數據庫的CLOB字段中, 我們都知道textarea中的信息當然不能直接保存成CLOB,我們在后臺得到的是String類型的,不多說拉,我們還是以一個實例講吧!

          先建一個test表,表有2個字段:ID,CONTENTS,其中CONTENTS保存CLOB類型的文本數據

          create table TEST
          (
          ID VARCHAR2(18) not null,
          CONTENTS CLOB,
          )

          接著我們編寫一個測試用的jsp文件ClobTest.jsp,代碼如下



          <%@ page language="java" contentType="text/html; charset=gb2312" %>

          <html>

          <head>

          <meta http-equiv="Content-Type" content="text/html; charset=gb2312">

          <title>Clob對象的存取測試</title>

          </head>



          <body>

          <form name="test" method="post" action="clobTest.action">

          <table width="80%" height="88" border="0" align="center" cellpadding="0" cellspacing="0">

          <tr>

          <td height="30" align="center">輸入ID號<input type="text" name="ID">

          </tr>

          <tr>

          <td align="center">

          <textarea rows="28" cols="68" name="CONTENTS">

          注冊用戶需遵守:

          尊重會員個人隱私、保障會員隱私安全是CSDN的一項基本政策,CSDN不會公開、編輯或透露會員的注冊資料,除非符合以下情況:
          (1) 根據中華人民共和國國家安全機構、公安部門的要求及根據相應的法律程序要求。
          (2) 維護CSDN的商標所有權及其它權益。
          (3) 在緊急情況下竭力維護會員個人、其它社會個體和社會大眾的安全。
          (4) 嚴重違反CSDN有關規定。
          CSDN保留結束會員使用網絡服務資格的權利,并保證結束會員資格后仍為會員保密所有個人隱私。

          </textarea>

          </td>

          </tr>

          <tr>

          <td align="center">

          <input type="submit" name="Submit" value="提交">

          </td>

          </tr>

          </table>

          </form>

          </body>

          </html>

          點擊”提交”按鈕,我們在后臺的到的是2個String類型的對象

          String strID = request.getParameter(“ID”);

          String strCONTENTS = request.getParameter(“CONTENTS”);

          接著我們要做的任務就是如何把String類型CONTENTS存到數據庫中的CLOB類型字段中!

          注意:LOB數據不能象其它類型數據一樣直接插入(INSERT)。插入前必須先插入一個空的LOB對象,CLOB類型的空對象為EMPTY_CLOB(),BLOB類型的空對象為EMPTY_BLOB()。之后通過SELECT命令查詢得到先前插入的記錄并鎖定,繼而將空對象修改為所要插入的LOB對象。

          //我們先插入一個空的CLOB對象

          public int insertEmptyClob() throws Exception {

          Statement statement = null;

          int intResult = -1;

          try {

          //創建數據庫操作語句

          statement = connection.createStatement();

          //定義SQL語句

          String strSQL = “INSET INTO TEST (ID,CONTENTS) VALUES(strID, EMPTY_CLOB())”;

          //執行SQL語句

          intResult = statement.executeUpdate(strSQL);

          System.out.println(" intResult valus is"+intResult);

          return intResult;

          } catch(Exception e) {

          e.printStackTrace();

          return -1;

          } finally {

          if (statement != null) {

          statement.close();

          }

          }

          }

          //把strCONTENT插入CLOB字段

          public void insertClob() throws Exception {

          Statement statement = null;

          ResultSet resultset = null;

          try {

          //設置不自動提交

          connection.setAutoCommit(false);

          //創建數據庫操作語句

          statement = connection.createStatement();

          //定義SQL語句

          String strSQL = “SELECT CONTENTS FROM TEST WHERE ID=strID"”

          resultset = statement.executeQuery(strSQL);

          oracle.sql.CLOB contents = null;

          while(resultset.next()) {

          //取出CLOB對象

          contents = (oracle.sql.CLOB)resultset.getClob("CONTENTS");

          }

          Writer out = contents.getCharacterOutputStream();

          out.write(strContents);

          out.flush();

          out.close();

          //數據庫提交

          connection.commit();

          } catch(Exception e) {

          e.printStackTrace();

          }finally{

          if(resultset != null) {

          resultset.close();

          }

          if(statement != null) {

          statement.close();

          }

          }

          }

          OK,我們已經把這段文本以CLOB字段的形式保存到數據庫中了,在實際應用中,如果要保存或修改一條記錄,我們要分2步做,先保存或修改非LOB字段類型的字段,再保存或修改LOB字段!接下來我們來把剛才保存到數據庫中的CLOB字段讀到jsp頁面中去。

          我們在保存的時候,CLOB字段會把上面textarea中的文本按原來的格式一行一行(包括空格)都保存到CLOB字段中,讀取的時候我們只要按照原來格式讀起出來就行了(我這里自己用了一個小處理方法,但如果你有更好的方法請告訴我)。在這里我們把CLOB讀到StringBuffer中,為了保存不同行我在行之間加了個“&”字符來區分。最后轉化成String

          放到VO中,這樣就保證從前臺到后臺,從后臺到前臺的數據傳遞的一致性!代碼如下:







          /**

          * 獲取CLOB文本對象

          * @param sbSQL

          * @return

          * @throws java.lang.Exception

          */

          public String selectIncludeClob(StringBuffer sbSQL) throws Exception {

          Statement stmt = null;

          ResultSet rs = null;

          StringBuffer sbResult = new StringBuffer();

          try {

          //設定數據庫不自動提交

          //connection.setAutoCommit(false);

          //創建數據庫操作語句

          stmt = connection.createStatement();

          //獲取結果集

          rs = stmt.executeQuery(sbSQL.toString());



          while(rs.next()) {

          CLOB clob = (CLOB)rs.getClob("CONTENTS");

          Reader isClob = clob.getCharacterStream();

          BufferedReader bfClob = new BufferedReader(isClob);

          String strClob = bfClob.readLine();

          while(strClob != null) {

          sbResult.append(strClob);

          sbResult.append("&");

          strClob = bfClob.readLine();

          }

          }

          //提交事務

          // connection.commit();

          } catch(Exception e) {

          e.printStackTrace();

          throw e;

          } finally {

          if(rs != null) {

          rs.close();

          }

          if(stmt != null) {

          stmt.close();

          }

          }

          return sbResult.toString();

          }

          到jsp頁面中,我們從VO中獲取改文本信息。

          <textarea rows="42" cols="68" name="CONTENTS" style="border-style: solid; border-color: #FFFFFF; font-family:仿宋_GB2312; font-size:14pt; line-height:200%; margin-top:8; margin-bottom:6" >

          <%

          String content = vo.getContent();

          String[] contentArray = content.split("&");

          for(int i=0;i<contentArray.length;i++) {

          String s= contentArray[i];

          out.println(s);

          }

          %>

          </textarea>

          這樣我們就保證什么格式保存就以什么格式顯示。

          2.BLOB字段,二進制LOB,主要存儲二進制數據,最長為4G,在J2EE程序中,一般類似于圖片和文件的保存。當然也有另一種方法,就把圖片和文件保存在硬盤上,數據庫中只保存圖片的鏈接地址和文件在服務器上的路徑。如果遇到文件和圖片比較重要的還是需要保存到數據庫中(例如:我們做國土資源項目的時候,好多圖片、文件就很重要,需要保存到數據庫中),下面我寫一個保存文件到數據庫的Blob字段和從數據庫的Blob字段中獲取文件的方法(當然完全應用還要做其他工作,這里就不多說了,如果你不清楚的可以問我):

          /**

          * 把上傳的文件保存到數據庫的Blob字段中

          * @param strTableName 對應的表名稱

          * @param strColumnName 表中保存文件的Blob字段名稱

          * @param inputStream 輸入的文件流

          * @param sbSQLWhere where條件

          * @throws java.lang.Exception

          */

          public static void fileUpload(String strTableName,

          String strColumnName,

          InputStream inputStream,

          StringBuffer sbSQLWhere)

          throws Exception {

          Connection con = null;

          ResultSet resultset = null;

          Statement stmt = null;

          try {

          //得到數據庫連接

          con = DBConnector.getConnection();

          //構建查詢語句

          StringBuffer sbSQL = new StringBuffer();

          sbSQL.append(" UPDATE ");

          sbSQL.append(strTableName);

          sbSQL.append(" SET ");

          sbSQL.append(strColumnName);

          sbSQL.append("=EMPTY_BLOB() ");

          sbSQL.append(sbSQLWhere);

          System.out.println(" update sql value is*******"+sbSQL.toString());

          //獲取數據庫操作語句

          stmt=con.createStatement();

          //插入空的blob對象

          stmt.executeUpdate(sbSQL.toString());

          con.setAutoCommit(false);

          StringBuffer sbSQLBlob = new StringBuffer();

          sbSQLBlob.append(" SELECT ");

          sbSQLBlob.append(strColumnName);

          sbSQLBlob.append(" FROM ");

          sbSQLBlob.append(strTableName);

          sbSQLBlob.append(sbSQLWhere);

          sbSQLBlob.append(" FOR UPDATE");

          System.out.println(" select sql value is*********"+sbSQL.toString());

          resultset =stmt.executeQuery(sbSQLBlob.toString());

          while (resultset.next()) {

          /* 取出此BLOB對象 */

          oracle.sql.BLOB blob = (oracle.sql.BLOB)resultset.getBlob("BODY");

          /* 向BLOB對象中寫入數據 */

          BufferedOutputStream out = new BufferedOutputStream(blob.getBinaryOutputStream());

          BufferedInputStream in = new BufferedInputStream(inputStream);

          int c;

          while ((c=in.read())!=-1) {

          out.write(c);

          }

          in.close();

          out.close();

          }

          con.setAutoCommit(false);

          con.commit();

          } catch (Exception ex) {

          ex.printStackTrace();

          throw ex;

          } finally {

          if (stmt != null) {

          stmt.close();

          }

          if (resultset != null) {

          resultset.close();

          }

          if (con!=null) {

          con.close();

          }

          }

          }



          下面的方法是從數據庫中得到上傳的文件的輸入流,把輸入流寫到servlet流中,再從頁面中獲取,servlet就不寫了。

          /**

          * 方法描述:得到數據庫上傳的文件數據

          *

          * 輸入參數: 1:表名(String)

          * 2:字段名(String)

          * 3: Where條件(StringBuffer)

          * 5: 輸出流(ServletOutputStream)

          *

          * 輸出參數:void

          * 編寫人: */

          public static void getdownFile(String strTableName,

          String strColumnName,

          StringBuffer sbSQLWhere,

          ServletOutputStream sos) throws Exception {

          Connection con = null;

          PreparedStatement ps = null;

          ResultSet resultset = null;

          try {

          //得到數據庫連接

          con = DBConnector.getConnection();

          StringBuffer sbSQL = new StringBuffer();

          //構建查詢語句

          sbSQL.append(" SELECT " + strColumnName + " FROM " + strTableName);

          sbSQL.append(sbSQLWhere);



          System.out.println(" sql value is:"+sbSQLWhere.toString());



          ps = con.prepareStatement(sbSQL.toString());

          //執行查詢

          resultset = ps.executeQuery();

          while (resultset.next()) {

          //讀取數據流

          InputStream is = resultset.getBinaryStream(strColumnName);



          byte[] buf = new byte[2048];

          while(is.read(buf)!=-1) {

          //把數據流按塊寫到servlet的輸出流中

          sos.write(buf);

          }



          }

          } catch (Exception ex) {

          ex.printStackTrace();

          throw ex;

          } finally {

          if (ps != null) {

          ps.close();

          }

          if (resultset != null) {

          resultset.close();

          }

          if (con!=null) {

          con.close();

          }

          }

          }

          圖片的保存和文件的保存一樣,如果不清楚的可以和我聯系



          后記:

          平時總忙著做項目,閑的時候也很懶,總想把自己實際中的一些問題和解決方法小結一下,但總沒完成,這是第一次寫,寫的不好或不清楚的地方請包涵,下次改進,也希望大家多提意見,大家一起進步!!!!!!!!!!!

          posted @ 2007-01-16 16:14 一縷青煙 閱讀(194) | 評論 (0)編輯 收藏
          J2EE程序中使用oracle數據庫LOB字段的總結(elathen)
          ???http://www.souzz.net 2005-10-23 文章出處:博客園
          ?
          ????

          posted on 2005-05-27 09:36 輕松逍遙子

          最近在J2EE的項目中需要使用LOB字段保存文本信息以及圖片和文件,到網上搜拉一下,還不少,仔細看拉一下,但都不是很全有的還有錯誤,經過幾天的實踐,把問題都解決拉,順便總結一下,希望對需要的朋友有點參考

          LOB中我們用的比較多的主要有兩種CLOB和BLOB,我們對兩種類型分別討論

          1.CLOB是字符型LOB,主要存儲文本信息,,最長為4G.,在J2EE程序中,比如網頁的textarea中的字符信息比較長,Varchar2字段類型不能滿足時,我們就得用CLOB數據類型,我們這次項目中就碰到這種情況.現在我們先說說如何存取CLOB字段

          現在我要把網頁中的textarea元素的信息保存到數據庫的CLOB字段中, 我們都知道textarea中的信息當然不能直接保存成CLOB,我們在后臺得到的是String類型的,不多說拉,我們還是以一個實例講吧!

          先建一個test表,表有2個字段:ID,CONTENTS,其中CONTENTS保存CLOB類型的文本數據

          create table TEST
          (
          ID VARCHAR2(18) not null,
          CONTENTS CLOB,
          )

          接著我們編寫一個測試用的jsp文件ClobTest.jsp,代碼如下



          <%@ page language="java" contentType="text/html; charset=gb2312" %>

          <html>

          <head>

          <meta http-equiv="Content-Type" content="text/html; charset=gb2312">

          <title>Clob對象的存取測試</title>

          </head>



          <body>

          <form name="test" method="post" action="clobTest.action">

          <table width="80%" height="88" border="0" align="center" cellpadding="0" cellspacing="0">

          <tr>

          <td height="30" align="center">輸入ID號<input type="text" name="ID">

          </tr>

          <tr>

          <td align="center">

          <textarea rows="28" cols="68" name="CONTENTS">

          注冊用戶需遵守:

          尊重會員個人隱私、保障會員隱私安全是CSDN的一項基本政策,CSDN不會公開、編輯或透露會員的注冊資料,除非符合以下情況:
          (1) 根據中華人民共和國國家安全機構、公安部門的要求及根據相應的法律程序要求。
          (2) 維護CSDN的商標所有權及其它權益。
          (3) 在緊急情況下竭力維護會員個人、其它社會個體和社會大眾的安全。
          (4) 嚴重違反CSDN有關規定。
          CSDN保留結束會員使用網絡服務資格的權利,并保證結束會員資格后仍為會員保密所有個人隱私。

          </textarea>

          </td>

          </tr>

          <tr>

          <td align="center">

          <input type="submit" name="Submit" value="提交">

          </td>

          </tr>

          </table>

          </form>

          </body>

          </html>

          點擊”提交”按鈕,我們在后臺的到的是2個String類型的對象

          String strID = request.getParameter(“ID”);

          String strCONTENTS = request.getParameter(“CONTENTS”);

          接著我們要做的任務就是如何把String類型CONTENTS存到數據庫中的CLOB類型字段中!

          注意:LOB數據不能象其它類型數據一樣直接插入(INSERT)。插入前必須先插入一個空的LOB對象,CLOB類型的空對象為EMPTY_CLOB(),BLOB類型的空對象為EMPTY_BLOB()。之后通過SELECT命令查詢得到先前插入的記錄并鎖定,繼而將空對象修改為所要插入的LOB對象。

          //我們先插入一個空的CLOB對象

          public int insertEmptyClob() throws Exception {

          Statement statement = null;

          int intResult = -1;

          try {

          //創建數據庫操作語句

          statement = connection.createStatement();

          //定義SQL語句

          String strSQL = “INSET INTO TEST (ID,CONTENTS) VALUES(strID, EMPTY_CLOB())”;

          //執行SQL語句

          intResult = statement.executeUpdate(strSQL);

          System.out.println(" intResult valus is"+intResult);

          return intResult;

          } catch(Exception e) {

          e.printStackTrace();

          return -1;

          } finally {

          if (statement != null) {

          statement.close();

          }

          }

          }

          //把strCONTENT插入CLOB字段

          public void insertClob() throws Exception {

          Statement statement = null;

          ResultSet resultset = null;

          try {

          //設置不自動提交

          connection.setAutoCommit(false);

          //創建數據庫操作語句

          statement = connection.createStatement();

          //定義SQL語句

          String strSQL = “SELECT CONTENTS FROM TEST WHERE ID=strID"”

          resultset = statement.executeQuery(strSQL);

          oracle.sql.CLOB contents = null;

          while(resultset.next()) {

          //取出CLOB對象

          contents = (oracle.sql.CLOB)resultset.getClob("CONTENTS");

          }

          Writer out = contents.getCharacterOutputStream();

          out.write(strContents);

          out.flush();

          out.close();

          //數據庫提交

          connection.commit();

          } catch(Exception e) {

          e.printStackTrace();

          }finally{

          if(resultset != null) {

          resultset.close();

          }

          if(statement != null) {

          statement.close();

          }

          }

          }

          OK,我們已經把這段文本以CLOB字段的形式保存到數據庫中了,在實際應用中,如果要保存或修改一條記錄,我們要分2步做,先保存或修改非LOB字段類型的字段,再保存或修改LOB字段!接下來我們來把剛才保存到數據庫中的CLOB字段讀到jsp頁面中去。

          我們在保存的時候,CLOB字段會把上面textarea中的文本按原來的格式一行一行(包括空格)都保存到CLOB字段中,讀取的時候我們只要按照原來格式讀起出來就行了(我這里自己用了一個小處理方法,但如果你有更好的方法請告訴我)。在這里我們把CLOB讀到StringBuffer中,為了保存不同行我在行之間加了個“&”字符來區分。最后轉化成String

          放到VO中,這樣就保證從前臺到后臺,從后臺到前臺的數據傳遞的一致性!代碼如下:







          /**

          * 獲取CLOB文本對象

          * @param sbSQL

          * @return

          * @throws java.lang.Exception

          */

          public String selectIncludeClob(StringBuffer sbSQL) throws Exception {

          Statement stmt = null;

          ResultSet rs = null;

          StringBuffer sbResult = new StringBuffer();

          try {

          //設定數據庫不自動提交

          //connection.setAutoCommit(false);

          //創建數據庫操作語句

          stmt = connection.createStatement();

          //獲取結果集

          rs = stmt.executeQuery(sbSQL.toString());



          while(rs.next()) {

          CLOB clob = (CLOB)rs.getClob("CONTENTS");

          Reader isClob = clob.getCharacterStream();

          BufferedReader bfClob = new BufferedReader(isClob);

          String strClob = bfClob.readLine();

          while(strClob != null) {

          sbResult.append(strClob);

          sbResult.append("&");

          strClob = bfClob.readLine();

          }

          }

          //提交事務

          // connection.commit();

          } catch(Exception e) {

          e.printStackTrace();

          throw e;

          } finally {

          if(rs != null) {

          rs.close();

          }

          if(stmt != null) {

          stmt.close();

          }

          }

          return sbResult.toString();

          }

          到jsp頁面中,我們從VO中獲取改文本信息。

          <textarea rows="42" cols="68" name="CONTENTS" style="border-style: solid; border-color: #FFFFFF; font-family:仿宋_GB2312; font-size:14pt; line-height:200%; margin-top:8; margin-bottom:6" >

          <%

          String content = vo.getContent();

          String[] contentArray = content.split("&");

          for(int i=0;i<contentArray.length;i++) {

          String s= contentArray[i];

          out.println(s);

          }

          %>

          </textarea>

          這樣我們就保證什么格式保存就以什么格式顯示。

          2.BLOB字段,二進制LOB,主要存儲二進制數據,最長為4G,在J2EE程序中,一般類似于圖片和文件的保存。當然也有另一種方法,就把圖片和文件保存在硬盤上,數據庫中只保存圖片的鏈接地址和文件在服務器上的路徑。如果遇到文件和圖片比較重要的還是需要保存到數據庫中(例如:我們做國土資源項目的時候,好多圖片、文件就很重要,需要保存到數據庫中),下面我寫一個保存文件到數據庫的Blob字段和從數據庫的Blob字段中獲取文件的方法(當然完全應用還要做其他工作,這里就不多說了,如果你不清楚的可以問我):

          /**

          * 把上傳的文件保存到數據庫的Blob字段中

          * @param strTableName 對應的表名稱

          * @param strColumnName 表中保存文件的Blob字段名稱

          * @param inputStream 輸入的文件流

          * @param sbSQLWhere where條件

          * @throws java.lang.Exception

          */

          public static void fileUpload(String strTableName,

          String strColumnName,

          InputStream inputStream,

          StringBuffer sbSQLWhere)

          throws Exception {

          Connection con = null;

          ResultSet resultset = null;

          Statement stmt = null;

          try {

          //得到數據庫連接

          con = DBConnector.getConnection();

          //構建查詢語句

          StringBuffer sbSQL = new StringBuffer();

          sbSQL.append(" UPDATE ");

          sbSQL.append(strTableName);

          sbSQL.append(" SET ");

          sbSQL.append(strColumnName);

          sbSQL.append("=EMPTY_BLOB() ");

          sbSQL.append(sbSQLWhere);

          System.out.println(" update sql value is*******"+sbSQL.toString());

          //獲取數據庫操作語句

          stmt=con.createStatement();

          //插入空的blob對象

          stmt.executeUpdate(sbSQL.toString());

          con.setAutoCommit(false);

          StringBuffer sbSQLBlob = new StringBuffer();

          sbSQLBlob.append(" SELECT ");

          sbSQLBlob.append(strColumnName);

          sbSQLBlob.append(" FROM ");

          sbSQLBlob.append(strTableName);

          sbSQLBlob.append(sbSQLWhere);

          sbSQLBlob.append(" FOR UPDATE");

          System.out.println(" select sql value is*********"+sbSQL.toString());

          resultset =stmt.executeQuery(sbSQLBlob.toString());

          while (resultset.next()) {

          /* 取出此BLOB對象 */

          oracle.sql.BLOB blob = (oracle.sql.BLOB)resultset.getBlob("BODY");

          /* 向BLOB對象中寫入數據 */

          BufferedOutputStream out = new BufferedOutputStream(blob.getBinaryOutputStream());

          BufferedInputStream in = new BufferedInputStream(inputStream);

          int c;

          while ((c=in.read())!=-1) {

          out.write(c);

          }

          in.close();

          out.close();

          }

          con.setAutoCommit(false);

          con.commit();

          } catch (Exception ex) {

          ex.printStackTrace();

          throw ex;

          } finally {

          if (stmt != null) {

          stmt.close();

          }

          if (resultset != null) {

          resultset.close();

          }

          if (con!=null) {

          con.close();

          }

          }

          }



          下面的方法是從數據庫中得到上傳的文件的輸入流,把輸入流寫到servlet流中,再從頁面中獲取,servlet就不寫了。

          /**

          * 方法描述:得到數據庫上傳的文件數據

          *

          * 輸入參數: 1:表名(String)

          * 2:字段名(String)

          * 3: Where條件(StringBuffer)

          * 5: 輸出流(ServletOutputStream)

          *

          * 輸出參數:void

          * 編寫人: */

          public static void getdownFile(String strTableName,

          String strColumnName,

          StringBuffer sbSQLWhere,

          ServletOutputStream sos) throws Exception {

          Connection con = null;

          PreparedStatement ps = null;

          ResultSet resultset = null;

          try {

          //得到數據庫連接

          con = DBConnector.getConnection();

          StringBuffer sbSQL = new StringBuffer();

          //構建查詢語句

          sbSQL.append(" SELECT " + strColumnName + " FROM " + strTableName);

          sbSQL.append(sbSQLWhere);



          System.out.println(" sql value is:"+sbSQLWhere.toString());



          ps = con.prepareStatement(sbSQL.toString());

          //執行查詢

          resultset = ps.executeQuery();

          while (resultset.next()) {

          //讀取數據流

          InputStream is = resultset.getBinaryStream(strColumnName);



          byte[] buf = new byte[2048];

          while(is.read(buf)!=-1) {

          //把數據流按塊寫到servlet的輸出流中

          sos.write(buf);

          }



          }

          } catch (Exception ex) {

          ex.printStackTrace();

          throw ex;

          } finally {

          if (ps != null) {

          ps.close();

          }

          if (resultset != null) {

          resultset.close();

          }

          if (con!=null) {

          con.close();

          }

          }

          }

          圖片的保存和文件的保存一樣,如果不清楚的可以和我聯系



          后記:

          平時總忙著做項目,閑的時候也很懶,總想把自己實際中的一些問題和解決方法小結一下,但總沒完成,這是第一次寫,寫的不好或不清楚的地方請包涵,下次改進,也希望大家多提意見,大家一起進步!!!!!!!!!!!

          posted @ 2007-01-16 16:14 一縷青煙 閱讀(238) | 評論 (0)編輯 收藏
          方法1:
          1. xmlhttp.setRequestHeader("Cache-Control","no-cache");
          2. url += "&random="+Math.random();
          3. url += "&timestamp="+new Date().getTime();

          方法二:

          //處理頁面緩存
          ??response.setHeader("Pragma","No-cache");
          ??response.setHeader("Cache-Control","no-cache");
          ??response.setDateHeader("Expires", 0);
          posted @ 2007-01-11 14:56 一縷青煙 閱讀(577) | 評論 (0)編輯 收藏

          正則表達式經典 (轉)
          "^\d+$"  //非負整數(正整數 + 0)

          "^[0-9]*[1-9][0-9]*$"  //正整數

          "^((-\d+)|(0+))$"  //非正整數(負整數 + 0)

          "^-[0-9]*[1-9][0-9]*$"  //負整數

          "^-?\d+$"    //整數

          "^\d+(\.\d+)?$"  //非負浮點數(正浮點數 + 0)

          "^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$"  //正浮點數

          "^((-\d+(\.\d+)?)|(0+(\.0+)?))$"  //非正浮點數(負浮點數 + 0)

          "^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$"  //負浮點數

          "^(-?\d+)(\.\d+)?$"  //浮點數

          "^[A-Za-z]+$"  //由26個英文字母組成的字符串

          "^[A-Z]+$"  //由26個英文字母的大寫組成的字符串

          "^[a-z]+$"  //由26個英文字母的小寫組成的字符串

          "^[A-Za-z0-9]+$"  //由數字和26個英文字母組成的字符串

          "^\w+$"  //由數字、26個英文字母或者下劃線組成的字符串

          "^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$"    //email地址

          "^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$"

          ----------------------------------------------------------------------------------------------------------------------

          字符描述: \:將下一個字符標記為特殊字符或字面值。例如"n"與字符"n"匹配。"\n"與換行符匹配。序列"\\"與"\"匹配,"\("與"("匹配。

          ^ :匹配輸入的開始位置。

          $ :匹配輸入的結尾。

          * :匹配前一個字符零次或幾次。例如,"zo*"可以匹配"z"、"zoo"。

          + :匹配前一個字符一次或多次。例如,"zo+"可以匹配"zoo",但不匹配"z"。

          ? :匹配前一個字符零次或一次。例如,"a?ve?"可以匹配"never"中的"ve"。

          .:匹配換行符以外的任何字符。

          (pattern) 與模式匹配并記住匹配。匹配的子字符串可以從作為結果的 Matches 集合中使用 Item [0]...[n]取得。如果要匹配括號字符(和 ),可使用"\(" 或 "\)"。

          x|y:匹配 x 或 y。例如 "z|food" 可匹配 "z" 或 "food"。"(z|f)ood" 匹配 "zoo" 或 "food"。

          {n}:n 為非負的整數。匹配恰好n次。例如,"o{2}" 不能與 "Bob 中的 "o" 匹配,但是可以與"foooood"中的前兩個o匹配。

          {n,} :n 為非負的整數。匹配至少n次。例如,"o{2,}"不匹配"Bob"中的"o",但是匹配"foooood"中所有的o。"o{1,}"等價于"o+"。"o{0,}"等價于"o*"。

          {n,m} :m 和 n 為非負的整數。匹配至少 n 次,至多 m 次。例如,"o{1,3}" 匹配 "fooooood"中前三個o。"o{0,1}"等價于"o?"。

          [xyz] :一個字符集。與括號中字符的其中之一匹配。例如,"[abc]" 匹配"plain"中的"a"。

          [^xyz] :一個否定的字符集。匹配不在此括號中的任何字符。例如,"[^abc]" 可以匹配"plain"中的"p".

          [a-z] :表示某個范圍內的字符。與指定區間內的任何字符匹配。例如,"[a-z]"匹配"a"與"z"之間的任何一個小寫字母字符。

          [^m-z] :否定的字符區間。與不在指定區間內的字符匹配。例如,"[m-z]"與不在"m"到"z"之間的任何字符匹配。

          \b :與單詞的邊界匹配,即單詞與空格之間的位置。例如,"er\b" 與"never"中的"er"匹配,但是不匹配"verb"中的"er"。

          \B :與非單詞邊界匹配。"ea*r\B"與"never early"中的"ear"匹配。

          \d :與一個數字字符匹配。等價于[0-9]。

          \D :與非數字的字符匹配。等價于[^0-9]。

          \f :與分頁符匹配。

          \n :與換行符字符匹配。

          \r :與回車字符匹配。

          \s :與任何白字符匹配,包括空格、制表符、分頁符等。等價于"[ \f\n\r\t\v]"。

          \S :與任何非空白的字符匹配。等價于"[^ \f\n\r\t\v]"。

          \t :與制表符匹配。

          \v :與垂直制表符匹配。

          \w :與任何單詞字符匹配,包括下劃線。等價于"[A-Za-z0-9_]"。

          \W :與任何非單詞字符匹配。等價于"[^A-Za-z0-9_]"。

          \num :匹配 num個,其中 num 為一個正整數。引用回到記住的匹配。例如,"(.)\1"匹配兩個連續的相同的字符。

          \n:匹配 n,其中n 是一個八進制換碼值。八進制換碼值必須是 1, 2 或 3 個數字長。

          例如,"\11" 和 "\011" 都與一個制表符匹配。"\0011"等價于"\001" 與 "1"。八進制換碼值不得超過 256。否則,只有前兩個字符被視為表達式的一部分。允許在正則表達式中使用ASCII碼。

          \xn:匹配n,其中n是一個十六進制的換碼值。十六進制換碼值必須恰好為兩個數字長。例如,"\x41"匹配"A"。"\x041"等價于"\x04" 和 "1"。允許在正則表達式中使用 ASCII 碼。

             好了,常用的方法和屬性就是這些了,上面的語法介紹的已經很詳細了,我們就沒有必要在羅嗦了,接下來我們來看看在具體的例子里面如何使用這些方法和屬性來校驗數據的合法性,我們還是舉個例子吧,比如,我們想要對用戶輸入的電子郵件進行校驗,那么,什么樣的數據才算是一個合法的電子郵件呢?我可以這樣輸入:uestc95@263.net,當然我也會這樣輸入:xxx@yyy.com.cn,但是這樣的輸入就是非法的:xxx@@com.cn或者@xxx.com.cn,等等,所以我們得出一個合法的電子郵件地址至少應當滿足以下幾個條件:

          1. 必須包含一個并且只有一個符號“@”

          2. 必須包含至少一個至多三個符號“.”

          3. 第一個字符不得是“@”或者“.”

          4. 不允許出現“@.”或者.@

          5. 結尾不得是字符“@”或者“.”

          所以根據以上的原則和上面表中的語法,我們很容易的就可以得到需要的模板如下:"(\w)+[@]{1}(\w)+[.]{1,3}(\w)+"

            接下來我們仔細分析一下這個模板,首先“\w”表示郵件的開始字符只能是包含下劃線的單詞字符,這樣,滿足了第三個條件;“[@]{1}”表示在電子郵件中應當匹配并且只能匹配一次字符“@”,滿足了條件一;同樣的“[.]{1,3}”表示在電子郵件中至少匹配1個至多匹配3個字符“.” ,滿足了第二個條件;模板最后的“(\w)+”表示結尾的字符只能是包含下劃線在內的單詞字符,滿足了條件五;模板中間的“(\w)+”滿足了條件四。

            然后,我們就直接調用剛才的那個函數CheckExp("(\w)+[@]{1}(\w)+[.]{1}(\w)+",待校驗的字符串)就好了,如果返回True就表示數據是合法的,否則就是不正確的,怎么樣,簡單吧。我們還可以寫出來校驗身份證號碼的模板:"([0-9]){15}";校驗URL的模板:"^http://{1}((\w)+[.]){1,3}"等等;我們可以看到,這些模板為我們提供了很好的可重利用的模塊,利用自己或者別人提供的各種模板,我們就可以方便快捷的進行數據的合法性校驗了,相信你一定會寫出非常通用的模板的。

            這樣,我們只要定制不同的模板,就可以實現對不同數據的合法性校驗了。所以,正則表達式對象中最重要的屬性就是:“Pattern”屬性,只要真正掌握了這個屬性,才可以自由的運用正則表達式對象來為我們的數據校驗進行服務。



          Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=560411

          posted @ 2006-12-04 09:36 一縷青煙 閱讀(258) | 評論 (0)編輯 收藏

          TCP協議 

          ==> TCP首部

          ??? 源端口號、目的端口號、位序號、位確認序號、首部長度、標志位、窗口大小、檢驗和、緊急指針和其它選項。
          ???
          ??? 一個IP地址和一個端口號也成為一個插口(socket)。插口對可唯一確定互聯網中每個TCP連接的雙方。


          ==> TCP連接的建立與終止

          ??? TCP是一個面向連接的協議,無論哪方向另一方發送數據之前,都必須先在雙方之間建立一條連接。
          ??? TCP連接的建立——三次握手。
          ??? TCP連接的終止——四次握手。這是由TCP的半關閉造成的。因為TCP是全雙工的,因此每個方向必須單獨的進行關閉。


          ==> 最大報文段長度MSS

          ??? MSS越大,允許每個報文段傳遞的數據越多,相對TCP和IP的首部有更高的利用率。

          ??? 有些情況下,MSS是可以在建立TCP連接時進行協商的選項,但是有些情況下不行 。

          ??? * 如果是本地網絡,TCP可以根據網絡外出接口處的MTU值減去固定的IP首部(20)和TCP長度(20),對于以太網,可以達到1460。

          ??? * 如果IP地址為非本地的,則MSS通常定為默認值536字節(允許20字節的IP首部和20字節的TCP首部以適合576字節的IP數據報)。

          ??? MSS讓主機限制另一端發送數據的長度,同時也能控制它自己發送數據報的長度,避免較小MTU發生分片。


          ==> TCP的半關閉

          ??? TCP連接的一端在結束它的發送后還能接收來自另一端數據(直到它也發送FIN)的能力,這就是所謂的半關閉。應用程序很少用到。


          ==> 復位報文段

          ??? * 不存在的端口(目的端口沒有進程監聽)。目的主機將對SYN請求返回一個RST報文段。(UDP則將產生一個端口不可達的信息)

          ??? * 異常終止。

          ??? * 檢測半打開的連接。


          ==> TCP服務器的設計

          ??? * 大多數TCP服務器的進程是并發的.

          ??? * 只有處于監聽的進程才能處理客戶端的連接請求.

          ??? * TCP服務器可以對本地IP地址進行限制,但是一般不能對遠程IP地址進行限制.

            




          Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=561075

          posted @ 2006-12-04 09:35 一縷青煙 閱讀(353) | 評論 (0)編輯 收藏

          關于Java棧與堆的思考
          1. 棧(stack)與堆(heap)都是Java用來在Ram中存放數據的地方。與C++不同,Java自動管理棧和堆,程序員不能直接地設置棧或堆。

          2. 棧的優勢是,存取速度比堆要快,僅次于直接位于CPU中的寄存器。但缺點是,存在棧中的數據大小與生存期必須是確定的,缺乏靈活性。另外,棧數據可以共享,詳見第3點。堆的優勢是可以動態地分配內存大小,生存期也不必事先告訴編譯器,Java的垃圾收集器會自動收走這些不再使用的數據。但缺點是,由于要在運行時動態分配內存,存取速度較慢。

          3. Java中的數據類型有兩種。
          ? 一種是基本類型(primitive types), 共有8種,即int, short, long, byte, float, double, boolean, char(注意,并沒有string的基本類型)。這種類型的定義是通過諸如int a = 3; long b = 255L;的形式來定義的,稱為自動變量。值得注意的是,自動變量存的是字面值,不是類的實例,即不是類的引用,這里并沒有類的存在。如int a = 3; 這里的a是一個指向int類型的引用,指向3這個字面值。這些字面值的數據,由于大小可知,生存期可知(這些字面值固定定義在某個程序塊里面,程序塊退出后,字段值就消失了),出于追求速度的原因,就存在于棧中。
          ? 另外,棧有一個很重要的特殊性,就是存在棧中的數據可以共享。假設我們同時定義

          ? int a = 3;
          ? int b = 3;

          ?? 編譯器先處理int a = 3;首先它會在棧中創建一個變量為a的引用,然后查找有沒有字面值為3的地址,沒找到,就開辟一個存放3這個字面值的地址,然后將a指向3的地址。接著處理int b = 3;在創建完b的引用變量后,由于在棧中已經有3這個字面值,便將b直接指向3的地址。這樣,就出現了a與b同時均指向3的情況。

          ?? 特別注意的是,這種字面值的引用與類對象的引用不同。假定兩個類對象的引用同時指向一個對象,如果一個對象引用變量修改了這個對象的內部狀態,那么另一個對象引用變量也即刻反映出這個變化。相反,通過字面值的引用來修改其值,不會導致另一個指向此字面值的引用的值也跟著改變的情況。如上例,我們定義完a與 b的值后,再令a=4;那么,b不會等于4,還是等于3。在編譯器內部,遇到a=4;時,它就會重新搜索棧中是否有4的字面值,如果沒有,重新開辟地址存放4的值;如果已經有了,則直接將a指向這個地址。因此a值的改變不會影響到b的值。

          ? 另一種是包裝類數據,如Integer, String, Double等將相應的基本數據類型包裝起來的類。這些類數據全部存在于堆中,Java用new()語句來顯示地告訴編譯器,在運行時才根據需要動態創建,因此比較靈活,但缺點是要占用更多的時間。

          4. String是一個特殊的包裝類數據。即可以用String str = new String("abc");的形式來創建,也可以用String str = "abc";的形式來創建(作為對比,在JDK 5.0之前,你從未見過Integer i = 3;的表達式,因為類與字面值是不能通用的,除了String。而在JDK 5.0中,這種表達式是可以的!因為編譯器在后臺進行Integer i = new Integer(3)的轉換)。前者是規范的類的創建過程,即在Java中,一切都是對象,而對象是類的實例,全部通過new()的形式來創建。Java 中的有些類,如DateFormat類,可以通過該類的getInstance()方法來返回一個新創建的類,似乎違反了此原則。其實不然。該類運用了單例模式來返回類的實例,只不過這個實例是在該類內部通過new()來創建的,而getInstance()向外部隱藏了此細節。那為什么在String str = "abc";中,并沒有通過new()來創建實例,是不是違反了上述原則?其實沒有。

          5. 關于String str = "abc"的內部工作。Java內部將此語句轉化為以下幾個步驟:
          ? (1)先定義一個名為str的對String類的對象引用變量:String str;
          ?? (2)在棧中查找有沒有存放值為"abc"的地址,如果沒有,則開辟一個存放字面值為"abc"的地址,接著創建一個新的String類的對象o,并將o 的字符串值指向這個地址,而且在棧中這個地址旁邊記下這個引用的對象o。如果已經有了值為"abc"的地址,則查找對象o,并返回o的地址。
          ? (3)將str指向對象o的地址。
          ? 值得注意的是,一般String類中字符串值都是直接存值的。但像String str = "abc";這種場合下,其字符串值卻是保存了一個指向存在棧中數據的引用!
          ?
          ? 為了更好地說明這個問題,我們可以通過以下的幾個代碼進行驗證。

          ? String str1 = "abc";
          ? String str2 = "abc";
          ? System.out.println(str1==str2);? //true
          ?
          ? 注意,我們這里并不用str1.equals(str2);的方式,因為這將比較兩個字符串的值是否相等。==號,根據JDK的說明,只有在兩個引用都指向了同一個對象時才返回真值。而我們在這里要看的是,str1與str2是否都指向了同一個對象。
          ? 結果說明,JVM創建了兩個引用str1和str2,但只創建了一個對象,而且兩個引用都指向了這個對象。

          ? 我們再來更進一步,將以上代碼改成:

          ? String str1 = "abc";
          ? String str2 = "abc";
          ? str1 = "bcd";
          ? System.out.println(str1 + "," + str2);? //bcd, abc
          ? System.out.println(str1==str2);? //false

          ? 這就是說,賦值的變化導致了類對象引用的變化,str1指向了另外一個新對象!而str2仍舊指向原來的對象。上例中,當我們將str1的值改為"bcd"時,JVM發現在棧中沒有存放該值的地址,便開辟了這個地址,并創建了一個新的對象,其字符串的值指向這個地址。
          ?? 事實上,String類被設計成為不可改變(immutable)的類。如果你要改變其值,可以,但JVM在運行時根據新值悄悄創建了一個新對象,然后將這個對象的地址返回給原來類的引用。這個創建過程雖說是完全自動進行的,但它畢竟占用了更多的時間。在對時間要求比較敏感的環境中,會帶有一定的不良影響。

          ? 再修改原來代碼:

          ? String str1 = "abc";
          ? String str2 = "abc";
          ?
          ? str1 = "bcd";
          ?
          ? String str3 = str1;
          ? System.out.println(str3);? //bcd

          ? String str4 = "bcd";
          ? System.out.println(str1 == str4);? //true
          ???
          ? str3 這個對象的引用直接指向str1所指向的對象(注意,str3并沒有創建新對象)。當str1改完其值后,再創建一個String的引用str4,并指向因str1修改值而創建的新的對象。可以發現,這回str4也沒有創建新的對象,從而再次實現棧中數據的共享。

          ? 我們再接著看以下的代碼。

          ? String str1 = new String("abc");
          ? String str2 = "abc";
          ? System.out.println(str1==str2);? //false

          ? 創建了兩個引用。創建了兩個對象。兩個引用分別指向不同的兩個對象。

          ? String str1 = "abc";
          ? String str2 = new String("abc");
          ? System.out.println(str1==str2);? //false

          ? 創建了兩個引用。創建了兩個對象。兩個引用分別指向不同的兩個對象。

          ? 以上兩段代碼說明,只要是用new()來新建對象的,都會在堆中創建,而且其字符串是單獨存值的,即使與棧中的數據相同,也不會與棧中的數據共享。

          6. 數據類型包裝類的值不可修改。不僅僅是String類的值不可修改,所有的數據類型包裝類都不能更改其內部的值。

          7. 結論與建議:

          ?? (1)我們在使用諸如String str = "abc";的格式定義類時,總是想當然地認為,我們創建了String類的對象str。擔心陷阱!對象可能并沒有被創建!唯一可以肯定的是,指向 String類的引用被創建了。至于這個引用到底是否指向了一個新的對象,必須根據上下文來考慮,除非你通過new()方法來顯要地創建一個新的對象。因此,更為準確的說法是,我們創建了一個指向String類的對象的引用變量str,這個對象引用變量指向了某個值為"abc"的String類。清醒地認識到這一點對排除程序中難以發現的bug是很有幫助的。

          ? (2)使用String str = "abc";的方式,可以在一定程度上提高程序的運行速度,因為JVM會自動根據棧中數據的實際情況來決定是否有必要創建新對象。而對于String str = new String("abc");的代碼,則一概在堆中創建新對象,而不管其字符串值是否相等,是否有必要創建新對象,從而加重了程序的負擔。這個思想應該是享元模式的思想,但JDK的內部在這里實現是否應用了這個模式,不得而知。

          ? (3)當比較包裝類里面的數值是否相等時,用equals()方法;當測試兩個包裝類的引用是否指向同一個對象時,用==。

          ? (4)由于String類的immutable性質,當String變量需要經常變換其值時,應該考慮使用StringBuffer類,以提高程序效率。



          Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=561129

          posted @ 2006-12-04 09:31 一縷青煙 閱讀(460) | 評論 (0)編輯 收藏
          主站蜘蛛池模板: 石河子市| 安阳市| 平度市| 江门市| 平塘县| 当涂县| 淄博市| 上栗县| 武义县| 晋宁县| 湄潭县| 佛坪县| 奉节县| 宝丰县| 安福县| 颍上县| 土默特左旗| 剑河县| 文登市| 迁西县| 洪湖市| 调兵山市| 九江县| 罗平县| 伊金霍洛旗| 锦州市| 永靖县| 鹤壁市| 龙里县| 兴海县| 武宣县| 沁水县| 嵊泗县| 霍山县| 界首市| 翁牛特旗| 拜泉县| 沁水县| 罗城| 峨眉山市| 资阳市|