在軟件系統(tǒng)中,由于存在著各種各樣的字符編碼問題,比如另我們非常頭痛的中文問題。因此,現(xiàn)在趨向于使用UTF-8編碼作為軟件中通過編碼格式,從而可以避免大多數(shù)字符編碼的問題。本文跟《80前》一文一樣,以Spring項(xiàng)目無關(guān),請(qǐng)“春迷”們自重、沒事勿擾,文中不足之處歡迎大家批評(píng)指教。
在Java開發(fā)中,我們經(jīng)常使用Ant來編譯及打包項(xiàng)目。默認(rèn)情況下Ant會(huì)去調(diào)用一個(gè)名為build.xml文件,文件中定義了相關(guān)的單元及任務(wù)等,可以根據(jù)用戶命令執(zhí)行相應(yīng)的任務(wù)單元。
比如,在很多開源項(xiàng)目如Spring、webwork、EasyJWeb、EasyDBO等,其根目錄下都有一個(gè)build.xml文件。
在國外的開源項(xiàng)目中,build.xml文件中的內(nèi)容全部是英文字符,因此build.xml使用普通的ANSI或UTF-8或GBK都沒問題,也不會(huì)遇到字符編碼問題。而對(duì)于國產(chǎn)的開源項(xiàng)目EasyJWeb、EasyDBO來說,為了方便國內(nèi)的用戶,肯定在文件會(huì)包含一些中文說明。而默認(rèn)情況下包括中文字符,格式為ANSI的build.xml文件是無法正確運(yùn)行的,這應(yīng)該跟本人所寫的Dom4j的原因類似。
此時(shí),我們需要把build.xml文件改成UTF-8格式,并指定xml文件的格式為utf-8。如下面是EasyJWeb開源項(xiàng)目中build.xml文件的部分內(nèi)容:
<?xml version="1.0" encoding="UTF-8"?>
<project name="EasyJF" default="usage" basedir="." xmlns:artifact="urn:maven-artifact-ant">
?<property file="easyjfbuild.properties" />
?<!--目錄定義-->
在Java開發(fā)中,我們經(jīng)常使用Ant來編譯及打包項(xiàng)目。默認(rèn)情況下Ant會(huì)去調(diào)用一個(gè)名為build.xml文件,文件中定義了相關(guān)的單元及任務(wù)等,可以根據(jù)用戶命令執(zhí)行相應(yīng)的任務(wù)單元。
比如,在很多開源項(xiàng)目如Spring、webwork、EasyJWeb、EasyDBO等,其根目錄下都有一個(gè)build.xml文件。
在國外的開源項(xiàng)目中,build.xml文件中的內(nèi)容全部是英文字符,因此build.xml使用普通的ANSI或UTF-8或GBK都沒問題,也不會(huì)遇到字符編碼問題。而對(duì)于國產(chǎn)的開源項(xiàng)目EasyJWeb、EasyDBO來說,為了方便國內(nèi)的用戶,肯定在文件會(huì)包含一些中文說明。而默認(rèn)情況下包括中文字符,格式為ANSI的build.xml文件是無法正確運(yùn)行的,這應(yīng)該跟本人所寫的Dom4j的原因類似。
此時(shí),我們需要把build.xml文件改成UTF-8格式,并指定xml文件的格式為utf-8。如下面是EasyJWeb開源項(xiàng)目中build.xml文件的部分內(nèi)容:
<?xml version="1.0" encoding="UTF-8"?>
<project name="EasyJF" default="usage" basedir="." xmlns:artifact="urn:maven-artifact-ant">
?<property file="easyjfbuild.properties" />
?<!--目錄定義-->
?<property name="main.src.dir" value="${basedir}/src/main" />
?<property name="test.src.dir" value="${basedir}/src/test" />
?<property name="lib.dir" value="${basedir}/lib" />
?<property name="env.lib.dir" value="${lib.dir}/build/" />
?<property name="doc.dir" value="${basedir}/doc" />
?<property name="build.dir" value="${basedir}/build" />
?<property name="release.dir" value="${basedir}/release" />
?<property name="web.dir" value="${basedir}/webapps" />
?<property name="ide.dir" value="${basedir}/misc/ide" />
?<!--項(xiàng)目屬性-->
?<property name="project.provider.name" value="easyjf" />
?<property name="project.name" value="jweb" />
?<property name="project.author" value="?<property name="project.version" value="0.6" />
?<property name="test.src.dir" value="${basedir}/src/test" />
?<property name="lib.dir" value="${basedir}/lib" />
?<property name="env.lib.dir" value="${lib.dir}/build/" />
?<property name="doc.dir" value="${basedir}/doc" />
?<property name="build.dir" value="${basedir}/build" />
?<property name="release.dir" value="${basedir}/release" />
?<property name="web.dir" value="${basedir}/webapps" />
?<property name="ide.dir" value="${basedir}/misc/ide" />
?<!--項(xiàng)目屬性-->
?<property name="project.provider.name" value="easyjf" />
?<property name="project.name" value="jweb" />
?<property name="project.author" value="?<property name="project.version" value="0.6" />
?<!--發(fā)布文件名-->
….
這里的問題是如何建一個(gè)UTF-8格式的build.xml文件。
錯(cuò)誤的習(xí)慣:
在通常情況下,我們習(xí)慣于使用windows下的記事本等工具直接編碼xml文件內(nèi)容,并另存為UTF-8格式,如下圖所示:
?
這種方式建立的build.xml文件是不正確的,最讓人煩惱的是具有非常的不穩(wěn)定性。這個(gè)不穩(wěn)定性表現(xiàn)在一些系統(tǒng)下能正確使用,而一些系統(tǒng)下會(huì)出現(xiàn)類似如下的錯(cuò)誤:
….
這里的問題是如何建一個(gè)UTF-8格式的build.xml文件。
錯(cuò)誤的習(xí)慣:
在通常情況下,我們習(xí)慣于使用windows下的記事本等工具直接編碼xml文件內(nèi)容,并另存為UTF-8格式,如下圖所示:
?
這種方式建立的build.xml文件是不正確的,最讓人煩惱的是具有非常的不穩(wěn)定性。這個(gè)不穩(wěn)定性表現(xiàn)在一些系統(tǒng)下能正確使用,而一些系統(tǒng)下會(huì)出現(xiàn)類似如下的錯(cuò)誤:
D:\EasyJF\wlhy\bin>build.bat
Buildfile: ..\build.xml
BUILD FAILED
D:\EasyJF\wlhy\build.xml:1: 缺少文件根組件
Total time: 0 seconds
請(qǐng)按任意鍵繼續(xù). . .
D:\EasyJF\wlhy\build.xml:1: 缺少文件根組件
Total time: 0 seconds
請(qǐng)按任意鍵繼續(xù). . .
?
這個(gè)錯(cuò)誤也是EasyJF團(tuán)隊(duì)中的williamRaym在寫EasyJWeb的build腳本時(shí)發(fā)現(xiàn)的,而且后來又很多網(wǎng)友反映類似的錯(cuò)誤,如當(dāng)前EasyJF下的iula 項(xiàng)目就存在這個(gè)問題:
http://www.easyjf.com/html/bbs/20060814/1208824819851986.htm
?。ㄒ苍S是我的機(jī)器容錯(cuò)性好,不會(huì)報(bào)錯(cuò),呵呵!)。
http://www.easyjf.com/html/bbs/20060814/1208824819851986.htm
?。ㄒ苍S是我的機(jī)器容錯(cuò)性好,不會(huì)報(bào)錯(cuò),呵呵!)。
正確的方法:
前面說了,用記事本建立UTF-8格式的xml文件是不正確的,經(jīng)過我們多次實(shí)踐,正確的方法之一是使用Eclipse來建這個(gè)xml文件,在建立工程的時(shí)候需要把整個(gè)工程的字符集設(shè)置成為UTF-8,然后直接建立一個(gè)build.xml文件,默認(rèn)情況下該文件以UTF-8的格式保存。
這樣建立起來的腳本文件,使用Ant的時(shí)候,不管build.xml中包含什么中文字符,都能正常運(yùn)行。當(dāng)然,應(yīng)該還可以用其它的開發(fā)工具建立UTF-8格式的文件,還請(qǐng)大家來試驗(yàn)。另外也可以用JAVA自己寫一個(gè)小程序來把ANSI格式的文件轉(zhuǎn)成UTF-8文件,這樣也沒問題。
前面說了,用記事本建立UTF-8格式的xml文件是不正確的,經(jīng)過我們多次實(shí)踐,正確的方法之一是使用Eclipse來建這個(gè)xml文件,在建立工程的時(shí)候需要把整個(gè)工程的字符集設(shè)置成為UTF-8,然后直接建立一個(gè)build.xml文件,默認(rèn)情況下該文件以UTF-8的格式保存。
這樣建立起來的腳本文件,使用Ant的時(shí)候,不管build.xml中包含什么中文字符,都能正常運(yùn)行。當(dāng)然,應(yīng)該還可以用其它的開發(fā)工具建立UTF-8格式的文件,還請(qǐng)大家來試驗(yàn)。另外也可以用JAVA自己寫一個(gè)小程序來把ANSI格式的文件轉(zhuǎn)成UTF-8文件,這樣也沒問題。
?
小結(jié):
之所以很多開源項(xiàng)目的build過程中不會(huì)存在問題,是因?yàn)樗哪_本文件中沒有包含中文字符或其它字符。面在國產(chǎn)開源項(xiàng)目中,由于存在中文注釋、說明等,所以在建立build.xml文件的時(shí)候需要作一些特殊的處理,使用UTF-8格式的文件。當(dāng)然,本文還重點(diǎn)提出了兩種建立UTF-8文件的方法,其中用記事本是不穩(wěn)定的,錯(cuò)誤的;而用專業(yè)Java開發(fā)工具或JDK建立的腳本才是正確、穩(wěn)定的。
之所以很多開源項(xiàng)目的build過程中不會(huì)存在問題,是因?yàn)樗哪_本文件中沒有包含中文字符或其它字符。面在國產(chǎn)開源項(xiàng)目中,由于存在中文注釋、說明等,所以在建立build.xml文件的時(shí)候需要作一些特殊的處理,使用UTF-8格式的文件。當(dāng)然,本文還重點(diǎn)提出了兩種建立UTF-8文件的方法,其中用記事本是不穩(wěn)定的,錯(cuò)誤的;而用專業(yè)Java開發(fā)工具或JDK建立的腳本才是正確、穩(wěn)定的。
(注:本文作者,EasyJF開源團(tuán)隊(duì) 大峽,轉(zhuǎn)載請(qǐng)保留作者聲明!)