zyskm用夢想丈量人生,用奔跑丈量激情

          mysql字符集和校對規(guī)則

          字符集的概念大家都清楚,校對規(guī)則很多人不了解,一般數(shù)據(jù)庫開發(fā)中也用不到這個概念,mysql在這方便貌似很先進,大概介紹一下。
          簡要說明
          字符集和校對規(guī)則
          字符集是一套符號和編碼。校對規(guī)則是在字符集內(nèi)用于比較字符的一套規(guī)則。
          MySql在collation提供較強的支持,oracel在這方面沒查到相應(yīng)的資料。
          不同字符集有不同的校對規(guī)則,命名約定:以其相關(guān)的字符集名開始,通常包括一個語言名,并且以_ci(大小寫不敏感)、_cs(大小寫敏感)或_bin(二元)結(jié)束
          校對規(guī)則一般分為兩類:
          binary collation,二元法,直接比較字符的編碼,可以認(rèn)為是區(qū)分大小寫的,因為字符集中'A'和'a'的編碼顯然不同。
          字符集_語言名,utf8默認(rèn)校對規(guī)則是utf8_general_ci
          mysql字符集和校對規(guī)則有4個級別的默認(rèn)設(shè)置:服務(wù)器級、數(shù)據(jù)庫級、表級和連接級。
          具體來說,我們系統(tǒng)使用的是utf8字符集,如果使用utf8_bin校對規(guī)則執(zhí)行sql查詢時區(qū)分大小寫,使用utf8_general_ci 不區(qū)分大小寫。不要使用utf8_unicode_ci。
          如create database demo CHARACTER SET utf8; 默認(rèn)校對規(guī)則是utf8_general_ci 。
           
          Unicode與UTF8
          Unicode只是一個符號集,它只規(guī)定了符號的二進制代碼,卻沒有規(guī)定這個二進制代碼應(yīng)該如何存儲.
          UTF8字符集是存儲Unicode數(shù)據(jù)的一種可選方法。 mysql同時支持另一種實現(xiàn)ucs2。

          詳細說明

          字符集(charset):是一套符號和編碼。
          校對規(guī)則(collation):是在字符集內(nèi)用于比較字符的一套規(guī)則,比如定義'A'<'B'這樣的關(guān)系的規(guī)則。不同collation可以實現(xiàn)不同的比較規(guī)則,如'A'='a'在有的規(guī)則中成立,而有的不成立;進而說,就是有的規(guī)則區(qū)分大小寫,而有的無視。
          每個字符集有一個或多個校對規(guī)則,并且每個校對規(guī)則只能屬于一個字符集。

          binary collation,二元法,直接比較字符的編碼,可以認(rèn)為是區(qū)分大小寫的,因為字符集中'A'和'a'的編碼顯然不同。除此以外,還有更加復(fù)雜的比較規(guī)則,這些規(guī)則在簡單的二元法之上增加一些額外的規(guī)定,比較就更加復(fù)雜了。
          mysql5.1在字符集和校對規(guī)則的使用比其它大多數(shù)數(shù)據(jù)庫管理系統(tǒng)超前許多,可以在任何級別進行使用和設(shè)置,為了有效地使用這些功能,你需要了解哪些字符集和 校對規(guī)則是可用的,怎樣改變默認(rèn)值,以及它們怎樣影響字符操作符和字符串函數(shù)的行為。

          校對規(guī)則一般有這些特征:

           兩個不同的字符集不能有相同的校對規(guī)則。
           每個字符集有一個默認(rèn)校對規(guī)則。例如,utf8默認(rèn)校對規(guī)則是utf8_general_ci。
           存在校對規(guī)則命名約定:它們以其相關(guān)的字符集名開始,通常包括一個語言名,并且以_ci(大小寫不敏感)、_cs(大小寫敏感)或_bin(二元)結(jié)束


          確定默認(rèn)字符集和校對
           字符集和校對規(guī)則有4個級別的默認(rèn)設(shè)置:服務(wù)器級、數(shù)據(jù)庫級、表級和連接級。
           數(shù)據(jù)庫字符集和校對
           每一個數(shù)據(jù)庫有一個數(shù)據(jù)庫字符集和一個數(shù)據(jù)庫校對規(guī)則,它不能夠為空。CREATE DATABASE和ALTER DATABASE語句有一個可選的子句來指定數(shù)據(jù)庫字符集和校對規(guī)則:
           例如:
           CREATE DATABASE db_name    DEFAULT CHARACTER SET latin1 COLLATE latin1_swedish_ci;
           MySQL這樣選擇數(shù)據(jù)庫字符集和數(shù)據(jù)庫校對規(guī)則:
          ·         如果指定了CHARACTER SET X和COLLATE Y,那么采用字符集X和校對規(guī)則Y。
          ·         如果指定了CHARACTER SET X而沒有指定COLLATE Y,那么采用CHARACTER SET X和CHARACTER SET X的默認(rèn)校對規(guī)則。
          ·         否則,采用服務(wù)器字符集和服務(wù)器校對規(guī)則。
          在SQL語句中使用COLLATE
          •使用COLLATE子句,能夠為一個比較覆蓋任何默認(rèn)校對規(guī)則。COLLATE可以用于多種SQL語句中。
          使用WHERE:
           select * from pro_product where product_code='ABcdefg' collate utf8_general_ci
          Unicode與UTF8
          Unicode只是一個符號集,它只規(guī)定了符號的二進制代碼,卻沒有規(guī)定這個二進制代碼應(yīng)該如何存儲.Unicode碼可以采用UCS-2格式直接存儲.mysql支持ucs2字符集。
          UTF-8就是在互聯(lián)網(wǎng)上使用最廣的一種unicode的實現(xiàn)方式。其他實現(xiàn)方式還包括UTF-16和UTF-32,不過在互聯(lián)網(wǎng)上基本不用。
          UTF8字符集(轉(zhuǎn)換Unicode表示)是存儲Unicode數(shù)據(jù)的一種可選方法。它根據(jù) RFC 3629執(zhí)行。UTF8字符集的思想是不同Unicode字符采用變長字節(jié)序列編碼:
          ·         基本拉丁字母、數(shù)字和標(biāo)點符號使用一個字節(jié)。
          ·         大多數(shù)的歐洲和中東手寫字母適合兩個字節(jié)序列:擴展的拉丁字母(包括發(fā)音符號、長音符號、重音符號、低音符號和其它音符)、西里爾字母、希臘語、亞美尼亞語、希伯來語、阿拉伯語、敘利亞語和其它語言。
          ·         韓語、中文和日本象形文字使用三個字節(jié)序列。

          posted on 2011-10-24 14:59 zyskm 閱讀(1815) 評論(3)  編輯  收藏

          評論

          # re: mysql字符集和校對規(guī)則 2011-10-24 15:32 發(fā)電機組

          感謝樓主辛勤,普及了知識,一直想學(xué)習(xí)數(shù)據(jù)庫方面的知識  回復(fù)  更多評論   

          # re: mysql字符集和校對規(guī)則 2011-10-25 08:23 tbw淘寶

          很有實用價值啊   回復(fù)  更多評論   

          # re: mysql字符集和校對規(guī)則[未登錄] 2013-04-09 10:00 Mark

          多謝牛主!!  回復(fù)  更多評論   


          只有注冊用戶登錄后才能發(fā)表評論。


          網(wǎng)站導(dǎo)航:
           
          主站蜘蛛池模板: 金平| 镇平县| 罗田县| 娄烦县| 康定县| 资源县| 陇南市| 河西区| 康保县| 栖霞市| 城市| 枣强县| 武山县| 会东县| 邓州市| 土默特左旗| 雷州市| 安阳市| 锦州市| 台山市| 洞头县| 碌曲县| 定南县| 平谷区| 保靖县| 阿勒泰市| 安多县| 介休市| 内乡县| 昭平县| 通渭县| 塔河县| 蛟河市| 黑河市| 蕉岭县| 泰宁县| 西平县| 浮梁县| 林口县| 芜湖市| 天气|