GHawk

          2006年8月16日 #

          建議方正要是勝訴的話,為開源事業(yè)做點(diǎn)貢獻(xiàn)

          中國(guó)人民可以說(shuō)是被盜版和Windows慣壞了。在Linux默認(rèn)環(huán)境下的中文顯示至今慘不忍睹。
          看看現(xiàn)在一些主要的發(fā)行版本,默認(rèn)設(shè)置下的日語(yǔ)的顯示已經(jīng)相當(dāng)不錯(cuò)了。
          作為漢字發(fā)祥地且擁有眾多人口的中國(guó),實(shí)在是有些悲哀。
          文泉驛計(jì)劃正在為實(shí)現(xiàn)這個(gè)目標(biāo)努力。作為一個(gè)非盈利性組織,他們的貢獻(xiàn)的確值得贊賞。
          最近方正正在為字體的事情打官司,并提出了高額賠償?shù)囊蟆=ㄗh方正要是能夠勝訴的話,貢獻(xiàn)一些字體給開源組織,為弘揚(yáng)漢語(yǔ)言文化多做點(diǎn)貢獻(xiàn)。

          posted @ 2007-08-23 15:01 GHawk 閱讀(653) | 評(píng)論 (1)編輯 收藏

          Maven2 用于度量和品質(zhì)保證的插件


          以上是一些常用的用于品質(zhì)管理的插件。默認(rèn)情況下都不用配置,相當(dāng)方便。如果需要手動(dòng)配置的話,根據(jù)網(wǎng)上的文檔也相當(dāng)容易配置。
          apache的maven plugin頁(yè)面: http://maven.apache.org/plugins/
          codehaus mojo 頁(yè)面: http://mojo.codehaus.org

          posted @ 2007-05-28 14:32 GHawk 閱讀(1561) | 評(píng)論 (1)編輯 收藏

          Scripting in Mustang 的一點(diǎn)啟發(fā)

          2006 Sun Techdays Shanghai 的第2天下午有一個(gè)名為《Java Scripting: One VM, Many Languages》的Session。

          Rags為大家展示了Mustang的一個(gè)新特性,Scripting in Java——腳本語(yǔ)言支持。

          通過(guò)加入腳本引擎的支持,就能夠在Java中解釋Javascript,python,ruby等諸多腳本語(yǔ)言。

          對(duì)于這個(gè)特性,想到的一個(gè)可能的應(yīng)用就是在annotation中寫腳本語(yǔ)言,然后在代碼中用相應(yīng)的腳本語(yǔ)言引擎解釋執(zhí)行。
          保留到運(yùn)行時(shí)的annotation可以用實(shí)現(xiàn)aop的功能,使用非inline的腳本就可以更靈活地控制aspect的行為。

          比如:
          //inline scripting
          @ScriptBefore(script
          ="",language="javascript"?)
          public?void?foo()?{
          ???
          }

          //non-inline scripting
          @ScriptBefore(file
          ="scripts/logging.js",language="javascript")
          public?void?bar()?{

          }

          posted @ 2006-09-26 10:04 GHawk 閱讀(1329) | 評(píng)論 (3)編輯 收藏

          一個(gè)XPer提供的一些經(jīng)驗(yàn)

          前些天,和一位XPer進(jìn)行了一次愉快的談話。他向我講述了一些感覺很有效的實(shí)踐。

          關(guān)于過(guò)程和迭代
          他曾經(jīng)參與過(guò)的項(xiàng)目的迭代是以月為迭代單位的,但事實(shí)上每周都會(huì)重復(fù)一個(gè)簡(jiǎn)單的過(guò)程。
          在迭代過(guò)程中,他非常推崇Burn-Down Charts。這是一個(gè)Scrum的工具。通過(guò)Burn-Down Charts,能夠把過(guò)程中間的變化記錄下來(lái),使過(guò)程高度可視化。等到一次迭代完成,回顧一下所有的Burn-Down Charts就能作為改進(jìn)的判斷依據(jù)。
          KPT Meeting。所謂KPT Meeting就是 Keep-Prevent-Try metting。小組定期舉行KPT會(huì)議(基本上是每周一次)。在KTP會(huì)議上,通過(guò)頭腦風(fēng)暴的方式每個(gè)人(不是某幾個(gè)人)把各自認(rèn)為前一階段里做得好的方面寫在Keep一欄里;做得不好的方面寫在Prevent一欄里;希望嘗試的寫在Try一欄里。然后大家對(duì)這些項(xiàng)目進(jìn)行評(píng)估和篩選。下一階段中,Keep的項(xiàng)目繼續(xù)保持,Prevent的項(xiàng)目應(yīng)該杜絕,Try的項(xiàng)目進(jìn)行嘗試。

          工具
          在開展這些實(shí)踐的時(shí)候,交流比較頻繁。首推的工具是Mini white boardDC
          選擇Mini white board的原因并不是因?yàn)閹в?mini"聽上去會(huì)像 Mini Cooper 或者 iPod mini 那么cool。因?yàn)橐粔KA3左右大小的白板非常適合個(gè)人或者結(jié)對(duì)使用,而且環(huán)保(省去了草稿紙)。雖然整個(gè)團(tuán)隊(duì)也有用于大規(guī)模交流的更大的白板,但那屬于“競(jìng)爭(zhēng)資源”,各自使用自己的白板更為方便。
          交流結(jié)果產(chǎn)生后,為了不花不必要的時(shí)間去做精美的文檔,一臺(tái)輕便的DC往往是最合適的選擇。當(dāng)然,如果足夠,手機(jī)上的照相功能也可以完成同樣的任務(wù)。相比偷拍街上的MM,這些電子產(chǎn)品能夠?qū)崿F(xiàn)更大的價(jià)值。

          關(guān)于結(jié)對(duì)
          每天進(jìn)行6小時(shí)的結(jié)對(duì)編程,分3次,每次2小時(shí)。每次和不同的成員組隊(duì)。在結(jié)隊(duì)的時(shí)候充分利用了上面提到的工具進(jìn)行交流。如果出現(xiàn)兩個(gè)人不能解決的問(wèn)題的時(shí)候,會(huì)立即向整個(gè)團(tuán)隊(duì)提出,這樣可能導(dǎo)致一次stand-up meeting。即使問(wèn)題不能馬上解決,至少也能確保每個(gè)人都知道這個(gè)問(wèn)題。

          posted @ 2006-08-24 15:45 GHawk 閱讀(1446) | 評(píng)論 (0)編輯 收藏

          關(guān)于locale的設(shè)定 (轉(zhuǎn))

          轉(zhuǎn)自:http://www.syxin.com/2006/03/localelocale.html

          關(guān)于locale的設(shè)定
          ?
          locale是國(guó)際化與本土化過(guò)程中的一個(gè)非常重要的概念,個(gè)人認(rèn)為,對(duì)于中文用戶來(lái)說(shuō),通常會(huì)涉及到的國(guó)際化或者本土化,大致包含三個(gè)方面:看中文,寫中文,與window中文系統(tǒng)的兼容和通信。從實(shí)際經(jīng)驗(yàn)上看來(lái),locale的設(shè)定與看中文關(guān)系不大,但是與寫中文,及window分區(qū)的掛載方式有很密切的關(guān)系。本人認(rèn)為就像一個(gè)純英文的Windows能夠?yàn)g覽中文,日文或者意大利文網(wǎng)頁(yè)一樣,你不需要設(shè)定locale就可以看中文。那么,為什么要設(shè)定locale呢?什么時(shí)候會(huì)用到locale呢?

          一、為什么要設(shè)定locale
          正如前面我所講的,設(shè)定locale與你能否瀏覽中文的網(wǎng)頁(yè)沒(méi)有直接的關(guān)系,即便你把locale設(shè)置成en_US.ISO-8859-1這樣一個(gè)標(biāo)準(zhǔn)的英文locale你照樣可以瀏覽中文的網(wǎng)頁(yè),只要你的系統(tǒng)里面有相應(yīng)的字符集(這個(gè)都不一定需要)和合適的字體(如simsun),瀏覽器就可以把網(wǎng)頁(yè)翻譯成中文給你看。具體的過(guò)程是網(wǎng)絡(luò)把網(wǎng)頁(yè)傳送到你的機(jī)器上之后,瀏覽器會(huì)判斷相應(yīng)的編碼的字符集,根據(jù)網(wǎng)頁(yè)采用的字符集,去字體庫(kù)里面找合適的字體,然后由文字渲染工具把相應(yīng)的文字在屏幕上顯示出來(lái)。

          ?
          在下文本人會(huì)偶爾把字符集比喻成密碼本,個(gè)人覺得對(duì)于一些東西比較容易理解,假如你不習(xí)慣的話,把全文copy到任何文本編輯器,用字符集替換密碼本即可。
          ?
          那有時(shí)候網(wǎng)頁(yè)顯示亂碼或者都是方框是怎么回事呢?個(gè)人認(rèn)為,顯示亂碼是因?yàn)樵O(shè)定的字符集不對(duì)(或者沒(méi)有相應(yīng)的字符集),例如網(wǎng)頁(yè)是用UTF-8編碼的,你非要用GB2312去看,而系統(tǒng)根據(jù)GB2312去找字體,然后在屏幕上顯示,當(dāng)然是一堆的亂碼,也就是說(shuō)你用一個(gè)錯(cuò)誤的密碼本去翻譯發(fā)給你的電報(bào),當(dāng)然內(nèi)容那叫一個(gè)亂;至于有些時(shí)候?yàn)g覽的網(wǎng)頁(yè)能顯示一部分漢字,但有很多的地方是方框,能夠顯示漢字說(shuō)明瀏覽器已經(jīng)正確的判斷出了網(wǎng)頁(yè)的編碼,并在字體庫(kù)里面找到了相應(yīng)的文字,但是并不是每個(gè)字體庫(kù)都包含某個(gè)字符集全部的字體的緣故,有些時(shí)候會(huì)顯示不完全,找一個(gè)比較全的支持較多字符集的字體就可以了。
          ?

          既然我能夠?yàn)g覽中文網(wǎng)頁(yè),那為什么我還要設(shè)定locale呢?
          ?
          其實(shí)你有沒(méi)有想過(guò)這么一個(gè)問(wèn)題,為什么gentoo官方論壇上中文論壇的網(wǎng)頁(yè)是用UTF-8編碼的(雖然大家一直強(qiáng)烈建議用GB2312編碼),但是新浪網(wǎng)就是用GB2312編碼的呢?而Xorg的官方網(wǎng)頁(yè)竟然是ISO-8859-15編碼的,我沒(méi)有設(shè)定這個(gè)locale怎么一樣的能瀏覽呢?這個(gè)問(wèn)題就像是你有所有的密碼本,不論某個(gè)網(wǎng)站是用什么字符集編碼的,你都可以用你手里的密碼本把他們翻譯過(guò)來(lái),但問(wèn)題是雖然你能瀏覽中文網(wǎng)頁(yè),但是在整個(gè)操作系統(tǒng)里面流動(dòng)的還是英文字符。所以,就像你能聽懂英語(yǔ),也能聽懂中文。
          最根本的問(wèn)題是:你不可以寫中文。
          ?
          當(dāng)你決定要寫什么東西的時(shí)候,首先要決定的一件事情是用那種語(yǔ)言,對(duì)于計(jì)算機(jī)來(lái)說(shuō)就是你要是用哪一種字符集,你就必須告訴你的linux系統(tǒng),你想用那一本密碼本去寫你想要寫的東西。知道為什么需要用GB2312字符集去瀏覽新浪了吧,因?yàn)樾吕说木W(wǎng)頁(yè)是用GB2312寫的。
          ?
          為了讓你的Linux能夠輸入中文,就需要把系統(tǒng)的locale設(shè)定成中文的(嚴(yán)格說(shuō)來(lái)是locale中的語(yǔ)言類別LC_CTYPE ),例如zh_CN.GB2312、zh_CN.GB18030或者zh_CN.UTF-8。很多人都不明白這些古里古怪的表達(dá)方式。這個(gè)外星表達(dá)式規(guī)定了什么東西呢?這個(gè)問(wèn)題稍后詳述,現(xiàn)在只需要知道,這是locale的表達(dá)方式就可以了。
          ?
          二、到底什么是locale?
          locale這個(gè)單詞中文翻譯成地區(qū)或者地域,其實(shí)這個(gè)單詞包含的意義要寬泛很多。Locale是根據(jù)計(jì)算機(jī)用戶所使用的語(yǔ)言,所在國(guó)家或者地區(qū),以及當(dāng)?shù)氐奈幕瘋鹘y(tǒng)所定義的一個(gè)軟件運(yùn)行時(shí)的語(yǔ)言環(huán)境。
          ?
          這個(gè)用戶環(huán)境可以按照所涉及到的文化傳統(tǒng)的各個(gè)方面分成幾個(gè)大類,通常包括用戶所使用的語(yǔ)言符號(hào)及其分類(LC_CTYPE),數(shù)字(LC_NUMERIC),比較和排序習(xí)慣(LC_COLLATE),時(shí)間顯示格式(LC_TIME),貨幣單位(LC_MONETARY),信息主要是提示信息,錯(cuò)誤信息, 狀態(tài)信息, 標(biāo)題, 標(biāo)簽, 按鈕和菜單等(LC_MESSAGES),姓名書寫方式(LC_NAME),地址書寫方式(LC_ADDRESS),電話號(hào)碼書寫方式(LC_TELEPHONE),度量衡表達(dá)方式(LC_MEASUREMENT),默認(rèn)紙張尺寸大小(LC_PAPER)和locale對(duì)自身包含信息的概述(LC_IDENTIFICATION)。
          ?
          所以說(shuō),locale就是某一個(gè)地域內(nèi)的人們的語(yǔ)言習(xí)慣和文化傳統(tǒng)和生活習(xí)慣。一個(gè)地區(qū)的locale就是根據(jù)這幾大類的習(xí)慣定義的,這些locale定義文件放在/usr/share/i18n/locales目錄下面,例如en_US, zh_CN and de_DE@euro都是locale的定義文件,這些文件都是用文本格式書寫的,你可以用寫字板打開,看看里邊的內(nèi)容,當(dāng)然出了有限的注釋以外,大部分東西可能你都看不懂,因?yàn)槭怯玫腢nicode的字符索引方式。
          ?
          對(duì)于de_DE@euro的一點(diǎn)說(shuō)明,@后邊是修正項(xiàng),也就是說(shuō)你可以看到兩個(gè)德國(guó)的locale:
          /usr/share/i18n/locales/de_DE@euro
          /usr/share/i18n/locales/de_DE
          打開這兩個(gè)locale定義,你就會(huì)知道它們的差別在于de_DE@euro使用的是歐洲的排序、比較和縮進(jìn)習(xí)慣,而de_DE用的是德國(guó)的標(biāo)準(zhǔn)習(xí)慣。
          ?
          上面我們說(shuō)到了zh_CN.GB18030的前半部分,后半部分是什么呢?大部分Linux用戶都知道是系統(tǒng)采用的字符集。
          ?
          三、什么是字符集?
          字符集就是字符,尤其是非英語(yǔ)字符在系統(tǒng)內(nèi)的編碼方式,也就是通常所說(shuō)的內(nèi)碼,所有的字符集都放在/usr/share/i18n/charmaps,所有的字符集也都是用Unicode編號(hào)索引的。Unicode用統(tǒng)一的編號(hào)來(lái)索引目前已知的全部的符號(hào)。而字符集則是這些符號(hào)的編碼方式,或者說(shuō)是在網(wǎng)絡(luò)傳輸,計(jì)算機(jī)內(nèi)部通信的時(shí)候,對(duì)于不同字符的表達(dá)方式,Unicode是一個(gè)靜態(tài)的概念,字符集是一個(gè)動(dòng)態(tài)的概念,是每一個(gè)字符傳遞或傳輸?shù)木唧w形式。就像Unicode編號(hào)U59D0是代表姐姐的“姐”字,但是具體的這個(gè)字是用兩個(gè)字節(jié)表示,三個(gè)字節(jié),還是四個(gè)字節(jié)表示,是字符集的問(wèn)題。例如:UTF-8字符集就是目前流行的對(duì)字符的編碼方式,UTF-8用一個(gè)字節(jié)表示常用的拉丁字母,用兩個(gè)字節(jié)表示常用的符號(hào),包括常用的中文字符,用三個(gè)表示不常用的字符,用四個(gè)字節(jié)表示其他的古靈精怪的字符。而GB2312字符集就是用兩個(gè)字節(jié)表示所有的字符。需要提到一點(diǎn)的是Unicode除了用編號(hào)索引全部字符以外,本身是用四個(gè)字節(jié)存儲(chǔ)全部字符,這一點(diǎn)在談到掛載windows分區(qū)的時(shí)候是非常重要的一個(gè)概念。所以說(shuō)你也可以把Unicode看作是一種字符集(我不知道它和UTF-32的關(guān)系,反正UTF-32就是用四個(gè)字節(jié)表示所有的字符的),但是這樣表述符號(hào)是非常浪費(fèi)資源的,因?yàn)樵谟?jì)算機(jī)世界絕大部分時(shí)候用到的是一個(gè)字節(jié)就可以搞定的26個(gè)字母而已。所以才會(huì)有UTF-8,UTF-16等等,要不然大同世界多好,省了這許多麻煩。
          ?

          四、zh_CN.GB2312到底是在說(shuō)什么?
          Locale 是軟件在運(yùn)行時(shí)的語(yǔ)言環(huán)境, 它包括語(yǔ)言(Language), 地域 (Territory) 和字符集(Codeset)。一個(gè)locale的書寫格式為: 語(yǔ)言[_地域[.字符集]]. 所以說(shuō)呢,locale總是和一定的字符集相聯(lián)系的。下面舉幾個(gè)例子:
          ?
          1、我說(shuō)中文,身處中華人民共和國(guó),使用國(guó)標(biāo)2312字符集來(lái)表達(dá)字符。
          zh_CN.GB2312=中文_中華人民共和國(guó)+國(guó)標(biāo)2312字符集。
          ?
          2、我說(shuō)中文,身處中華人民共和國(guó),使用國(guó)標(biāo)18030字符集來(lái)表達(dá)字符。
          zh_CN.GB18030=中文_中華人民共和國(guó)+國(guó)標(biāo)18030字符集。
          ?
          3、我說(shuō)中文,身處中華人民共和國(guó)臺(tái)灣省,使用國(guó)標(biāo)Big5字符集來(lái)表達(dá)字符。
          zh_TW.BIG5=中文_臺(tái)灣.大五碼字符集
          ?
          4、我說(shuō)英文,身處大不列顛,使用ISO-8859-1字符集來(lái)表達(dá)字符。
          en_GB.ISO-8859-1=英文_大不列顛.ISO-8859-1字符集
          ?
          5、我說(shuō)德語(yǔ),身處德國(guó),使用UTF-8字符集,習(xí)慣了歐洲風(fēng)格。
          de_DE.UTF-8@euro=德語(yǔ)_德國(guó).UTF-8字符集@按照歐洲習(xí)慣加以修正
          ?
          注意不是de_DE@euro.UTF-8,所以完全的locale表達(dá)方式是
          [語(yǔ)言[_地域][.字符集] [@修正值]
          ?
          生成的locale放在/usr/lib/locale/目錄中,并且每個(gè)locale都對(duì)應(yīng)一個(gè)文件夾,也就是說(shuō)創(chuàng)建了de_DE@euro.UTF-8 locale之后,就生成/usr/lib/locale/de_DE@euro.UTF-8/目錄,里面是具體的每個(gè)locale的內(nèi)容。
          ?
          五、怎樣去自定義locale
          在gentoo生成locale還是很容易的,首先要在USE里面加入userlocales支持,然后編輯locales.build文件,這個(gè)文件用來(lái)指示glibc生成locale文件。
          很多人不明白每一個(gè)條目是什么意思。 其實(shí)根據(jù)上面的說(shuō)明現(xiàn)在應(yīng)該很明確了。
          ?
          File: /etc/locales.build
          en_US/ISO-8859-1
          en_US.UTF-8/UTF-8
          ?
          zh_CN/GB18030
          zh_CN.GBK/GBK
          zh_CN.GB2312/GB2312
          zh_CN.UTF-8/UTF-8
          ?
          上面是我的locales.build文件,依次的說(shuō)明是這樣的:
          ?
          en_US/ISO-8859-1:生成名為en_US的locale,采用ISO-8859-1字符集,并且把這個(gè)locale作為英文_美國(guó)locale類的默認(rèn)值,其實(shí)它和en_US.ISO-8859-1/ISO-8859-1沒(méi)有任何區(qū)別。
          ?
          en_US.UTF-8/UTF-8:生成名為en_US.UTF-8的locale,采用UTF-8字符集。
          ?
          zh_CN/GB18030:生成名為zh_CN的locale,采用GB18030字符集,并且把這個(gè)locale作為中文_中國(guó)locale類的默認(rèn)值,其實(shí)它和zh_CN.GB18030/GB18030沒(méi)有任何區(qū)別。
          ?
          zh_CN.GBK/GBK:生成名為zh_CN.GBK的locale,采用GBK字符集。
          zh_CN.GB2312/GB2312:生成名為zh_CN.GB2312的locale,采用GB2312字符集。
          zh_CN.UTF-8/UTF-8:生成名為zh_CN.UTF-8的locale,采用UTF-8字符集。
          ?
          關(guān)于默認(rèn)locale,默認(rèn)locale可以簡(jiǎn)寫成en_US或者zh_CN的形式,只是為了表達(dá)簡(jiǎn)單而已沒(méi)有特別的意義。
          ?
          Gentoo在locale定義的時(shí)候掩蓋了一些東西,也就是locale的生成工具:localedef。
          在編譯完glibc之后你可以用這個(gè)localedef 再補(bǔ)充一些locale,就會(huì)更加理解locale了。具體的可以看 localedef 的manpage。
          ?
          $localedef -f 字符集 -i locale定義文件 生成的locale的名稱
          例如
          $localedef -f UTF-8 -i zh_CN zh_CN.UTF-8
          ?
          上面的定義方法和在locales.build中設(shè)定zh_CN.UTF-8/UTF-8的結(jié)果是一樣一樣的。
          ?

          六、locale的五臟六腑
          ?
          剛剛生成了幾個(gè)locale,但是為了讓它們生效,必須告訴Linux系統(tǒng)使用那(幾)個(gè)locale。這就需要對(duì)locale的內(nèi)部機(jī)制有一點(diǎn)點(diǎn)的了解。在前面我已經(jīng)提到過(guò),locale把按照所涉及到的文化傳統(tǒng)的各個(gè)方面分成12個(gè)大類,這12個(gè)大類分別是:
          1、語(yǔ)言符號(hào)及其分類(LC_CTYPE)
          2、數(shù)字(LC_NUMERIC)
          3、比較和排序習(xí)慣(LC_COLLATE)
          4、時(shí)間顯示格式(LC_TIME)
          5、貨幣單位(LC_MONETARY)
          6、信息主要是提示信息,錯(cuò)誤信息, 狀態(tài)信息, 標(biāo)題, 標(biāo)簽, 按鈕和菜單等(LC_MESSAGES)
          7、姓名書寫方式(LC_NAME)
          8、地址書寫方式(LC_ADDRESS)
          9、電話號(hào)碼書寫方式(LC_TELEPHONE)
          10、度量衡表達(dá)方式(LC_MEASUREMENT)
          11、默認(rèn)紙張尺寸大小(LC_PAPER)
          12、對(duì)locale自身包含信息的概述(LC_IDENTIFICATION)。
          ?
          其中,與中文輸入關(guān)系最密切的就是 LC_CTYPE, LC_CTYPE 規(guī)定了系統(tǒng)內(nèi)有效的字符以及這些字符的分類,諸如什么是大寫字母,小寫字母,大小寫轉(zhuǎn)換,標(biāo)點(diǎn)符號(hào)、可打印字符和其他的字符屬性等方面。而locale定義zh_CN中最最重要的一項(xiàng)就是定義了漢字(Class “hanzi”)這一個(gè)大類,當(dāng)然也是用Unicode描述的,這就讓中文字符在Linux系統(tǒng)中成為合法的有效字符,而且不論它們是用什么字符集編碼的。
          ?
          LC_CTYPE
          % This is a copy of the "i18n" LC_CTYPE with the following modifications: - Additional classes: hanzi
          ?
          copy "i18n"
          ?
          class "hanzi"; /
          % <U3400>..<U4DBF>;/
          <U4E00>..<U9FA5>;/
          <UF92C>;<UF979>;<UF995>;<UF9E7>;<UF9F1>;<UFA0C>;<UFA0D>;<UFA0E>;/
          <UFA0F>;<UFA11>;<UFA13>;<UFA14>;<UFA18>;<UFA1F>;<UFA20>;<UFA21>;/
          <UFA23>;<UFA24>;<UFA27>;<UFA28>;<UFA29>
          END LC_CTYPE
          ?
          在en_US的locale定義中,并沒(méi)有定義漢字,所以漢字不是有效字符。所以如果要輸入中文必須使用支持中文的locale,也就是zh_XX,如zh_CN,zh_TW,zh_HK等等。
          ?
          另外非常重要的一點(diǎn)就是這些分類是彼此獨(dú)立的,也就是說(shuō)LC_CTYPE,LC_COLLATE和 LC_MESSAGES等等分類彼此之間是獨(dú)立的,可以根據(jù)用戶的需要設(shè)定成不同的值。這一點(diǎn)對(duì)很多用戶是有利的,甚至是必須的。例如,我就需要一個(gè)能夠輸入中文的英文環(huán)境,所以我可以把LC_CTYPE設(shè)定成zh_CN.GB18030,而其他所有的項(xiàng)都是en_US.UTF-8。
          ?

          七、怎樣設(shè)定locale呢?
          ?
          設(shè)定locale就是設(shè)定12大類的locale分類屬性,即 12個(gè)LC_*。除了這12個(gè)變量可以設(shè)定以外,為了簡(jiǎn)便起見,還有兩個(gè)變量:LC_ALL和LANG。它們之間有一個(gè)優(yōu)先級(jí)的關(guān)系:
          LC_ALL>LC_*>LANG
          可以這么說(shuō),LC_ALL是最上級(jí)設(shè)定或者強(qiáng)制設(shè)定,而LANG是默認(rèn)設(shè)定值。
          1、如果你設(shè)定了LC_ALL=zh_CN.UTF-8,那么不管LC_*和LANG設(shè)定成什么值,它們都會(huì)被強(qiáng)制服從LC_ALL的設(shè)定,成為 zh_CN.UTF-8。
          2、假如你設(shè)定了LANG=zh_CN.UTF-8,而其他的LC_*=en_US.UTF-8,并且沒(méi)有設(shè)定LC_ALL的話,那么系統(tǒng)的locale設(shè)定以LC_*=en_US.UTF-8。
          3、假如你設(shè)定了LANG=zh_CN.UTF-8,而其他的LC_*,和LC_ALL均未設(shè)定的話,系統(tǒng)會(huì)將LC_*設(shè)定成默認(rèn)值,也就是LANG的值 zh_CN.UTF-8 。
          4、假如你設(shè)定了LANG=zh_CN.UTF-8,而其他的LC_CTYPE=en_US.UTF-8,其他的LC_*,和LC_ALL均未設(shè)定的話,那么系統(tǒng)的locale設(shè)定將是:LC_CTYPE=en_US.UTF-8,其余的 LC_COLLATE,LC_MESSAGES等等均會(huì)采用默認(rèn)值,也就是LANG的值,也就是LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=zh_CN.UTF-8。
          ?
          所以,locale是這樣設(shè)定的:
          1、如果你需要一個(gè)純中文的系統(tǒng)的話,設(shè)定LC_ALL= zh_CN.XXXX,或者LANG= zh_CN.XXXX都可以,當(dāng)然你可以兩個(gè)都設(shè)定,但正如上面所講,LC_ALL的值將覆蓋所有其他的locale設(shè)定,不要作無(wú)用功。
          2、如果你只想要一個(gè)可以輸入中文的環(huán)境,而保持菜單、標(biāo)題,系統(tǒng)信息等等為英文界面,那么只需要設(shè)定LC_CTYPE=zh_CN.XXXX,LANG=en_US.XXXX就可以了。這樣LC_CTYPE=zh_CN.XXXX,而LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=en_US.XXXX。
          3、假如你高興的話,可以把12個(gè)LC_*一一設(shè)定成你需要的值,打造一個(gè)古靈精怪的系統(tǒng):
          LC_CTYPE=zh_CN.GBK/GBK(使用中文編碼內(nèi)碼GBK字符集);
          LC_NUMERIC=en_GB.ISO-8859-1(使用大不列顛的數(shù)字系統(tǒng))
          LC_MEASUREMEN=de_DE@euro.ISO-8859-15(德國(guó)的度量衡使用ISO-8859-15字符集)
          羅馬的地址書寫方式,美國(guó)的紙張?jiān)O(shè)定……。估計(jì)沒(méi)人這么干吧。
          4、假如你什么也不做的話,也就是LC_ALL,LANG和LC_*均不指定特定值的話,系統(tǒng)將采用POSIX作為lcoale,也就是C locale。

          posted @ 2006-08-16 10:45 GHawk 閱讀(758) | 評(píng)論 (0)編輯 收藏

          主站蜘蛛池模板: 江川县| 巴彦县| 安龙县| 兴宁市| 万源市| 措勤县| 岳池县| 新竹市| 神池县| 忻州市| 鄂温| 西乌| 岑巩县| 福鼎市| 姜堰市| 大洼县| 图片| 武陟县| 鹿泉市| 三原县| 柳州市| 永和县| 宜宾县| 徐水县| 阳江市| 吴忠市| 花莲市| 长宁区| 保靖县| 渭源县| 华蓥市| 吉首市| 四会市| 永德县| 图片| 宜宾市| 徐闻县| 普兰店市| 登封市| 榆社县| 海口市|