Linux Unicode �~�程

archangel — Fri, 31 Aug 2007 11:37:00 GMT

Linux Unicode �~�程

如何�Q�在�E�序中）加入�q��?Unicode 以实现外语支�?/p>

文档选项

未显�C�需�?JavaScript 的文档选项

��此��作为电(sh��)子邮件发�?/font>

�U�别�Q?初��

Thomas W. Burger (twburger@bigfoot.com)Thomas Wolfgang Burger Consulting 的老板

2001 �q?8 �?01 �?/p>

作�ؓ(f��)一个计��机的多位字�W�表�C�系�l�，Unicode 支持世界上所有语�a�的编码和转换。这��文章说明了 Linux 应用�E�序中的国际语言支持的重要性，以及(qi��ng)规划 Unicode 支持�q�将之结合到 Linux 应用�E�序中去的思想�?/blockquote>
Unicode �q�不只是一个编�E�工��P��它还是一个政�ȝ��、经��的工具。没有结合世界的语言支持的应用程序通常只能被那些能��d�� ASCII 所支持语言的个��Z��用。这使得建立�?ASCII 基础之上的计��机技术脱��M��世界上大部分人。Unicode 允许�E�序使用世界上�Q何一�U�字�W�集�Q�因此它支持所有语�a��?/p>
Unicode 让程序员为普通�h提供用他们本国语�a��p��使用的��Y件。这样就不用再学一门外语了�Q�而且更容易实现计��机技术社�?x��)和财政上的利益。很�Ҏ(gu��)��设想�Q�如果用户必��Mؓ(f��)使用因特�|�浏览器而学�?f��n)乌��(d��ng)都语的话，�?zh��n)�就难以看到计算机在��国的��用。Web ��更不会(x��)出现了�?/p>
Linux 承担了对 Unicode 很大�E�度上的支持。Unicode 支持被嵌入到内核和代码开发库中。在很大�E�度上，使用�E�序中几句简单的命��o(h��)��p��它们自动的�l�合��C��码中�?/p>
所有现代字�W�集的基��都是�?1968 �q�以 ANSIX3.4 版本出版的美国信息交换标准码�Q�American Standard Code for Information Interchange�Q�ASCII�Q�。一个值得注意的例外是�?ASCII 之前定义�?IBM 的扩充的二进制编码的十进制交换码�Q�Extended Binary Coded Decimal Information Code�Q�EBCDIC�Q�。ASCII 是一个编码字�W�集�Q�coded character set�Q�CCS�Q�，换句话说�Q�它是整数到字符表示的映��。ASCII �~�码字符集允许用一个八位（��Z��二进制的�Q�用�?0 �?1 表示的）字段或字节（2^8 =256�Q�表�C?256 个字�W�。这是一个高度受限的�~�码字符集，它不能表�C��多不同语�a�的所有字�W�（如中文和日文�Q�，不能表示�U�学�W�号�Q�更不能表示古代文字�Q�神�U�符号和象�Ş文字�Q�和音乐�W�号。通过更改一个字节的长度而��更大的字�W�集得以被编码，�q�似乎有效但完全不切实际。所有的计算机都��Z��八位字节。解��x��法是一�U�字�W�编码方案（Character encoding scheme�Q�CES�Q��?用定长或变长的多字节序列能够表示�?256 大的�?�q�些数值接着通过�~�码字符集被映射到它们表�C�的字符�?/p>
Unicode 的定�?/span>

Unicode 通常用作涉及(qi��ng)双字节字�W�编码方案的通用术语。Unicode CCS 3.1 的官方称谓是 ISO10646-1 通用多八字节�~�码字符集（Universal Multiple Octet Coded Character Set�Q�UCS�Q�。Unicode 3.1 版本��d��?44,946 个新的编码字�W�。算�?Unicode 3.0 版本已经存在�?49,194 个字�W�，��p�� 94,140 个�?/p>
Unicode �~�码字符集利用了一个由 128 个三�l�的�l�构成的四维�~�码�I�间。其中每个组包含 256 个二�l��^面。每个��^面由 256 个一�l�的行组成，�q�且每个行有 256 个单元。每个单元在�q�个�~�码�I�间内对一个字�W�编码，或者被声明为未�l��用。这�U�编码概念被�U�Cؓ(f��) UCS-4�Q�四个八位元用来表示指定�l�、��^面、行和单元的每个字符�?/p>
�W�一个��^面（�W?00 �l�的�W?00 �q�面�Q�是基本多语�a��q�面�Q�Basic Multilingual Plane�Q�BMP�Q�。BMP 按字母、音节、表意符号和各种�W�号�?qi��ng)数字定义了常规使用的字�W�。后�l�的�q�面用于附加字符或其它还没有发明的编码实体。我们需要这完整的范围去处理世界上的所有语�a��Q�特别是拥有��近 64,000 个字�W�的一些东亚语�a��?/p>
BMP 被用作双字节的编码字�W�集�Q�这�U�编码字�W�集��定�?ISO 10646 UCS-2 格式。ISO 10646 UCS-2 ��是�?Unicode�Q��ƈ且两者相同）。BMP�Q�像所�?UCS �q�面那样�Q�包含了 256 行，其中每行包含 256 个单元，字符仅仅按照 BMP 中的行和单元的八位元在单元中被编码�?�q�就允许 16 位编码字�W�能够被用来书写大多数商业上最重要的语�a�。UCS-2 不需要代码页切换、代码扩展或代码状态。UCS-2 是一�U�将 Unicode �l�合到��Y件中的简单方法，但它只限于支�?Unicode BMP�?/p>
若要�?8 位字节表�C�Z��个多�?2^8 =256 个字�W�的字符�~�码�pȝ��Q�character coding system�Q�CCS�Q�，��需要一�U�字�W�编码方�?character-encoding scheme�Q�CES�Q��?/p>

回页�?/font>

Unicode 转换

�?UNIX 中，使用得最多的字符�~�码�Ҏ(gu��)��?UTF-8�?它考虑��C��Ҏ(gu��)��?Unicode 全部��和�q�面的全面支持，而且它仍能正��的识别 ASCII。除�?UTF-8 的其他选择�q�有�Q�UCS-4、UTF-16、UTF-7.5、UTF-7、SCSU、HTML �?JAVA�?/p>
Unicode 转换格式�Q�Unicode Transformation Formats�Q�UTFs�Q�是一�U�通过映射多字节编码中的值来支持 Unicode 的字�W�编码方案。本文将分析最��行的格�?�?UTF-8 字符�~�码�pȝ��?/p>
UTF-8

UTF-8 转换格式正逐步成�ؓ(f��)一�U�占��d��C��的交换国际文本信息的�Ҏ(gu��)��Q�因为它可以支持世界上所有的语言�Q�而且它还�?ASCII 兼容。UTF-8 使用变长�~�码。从 0 �?0x7f�Q?27�Q�的字符把自�w�编码成单字节，而将值更大的字符�~�码�?2 �?6 个字节�?/p>
�?1. UTF-8 �~�码

0x00000000 - 0x0000007F: 0 xxxxxxx

0x00000080 - 0x000007FF: 110 xxxxx10 xxxxxx

0x00000800 - 0x0000FFFF: 1110 xxxx10 xxxxxx10 xxxxxx

0x00010000 - 0x001FFFFF: 11110 xxx10 xxxxxx10 xxxxxx 10 xxxxxx

0x00200000 - 0x03FFFFFF: 111110 xx10 xxxxxx10 xxxxxx10 xxxxxx 10 xxxxxx

0x04000000 - 0x7FFFFFFF: 1111110 x10 xxxxxx10 xxxxxx10 xxxxxx 10 xxxxxx10 xxxxxx

字节 10 xxxxxx是一个扩展字节，它的 xxxxxx 位位�|�被以二�q�制表示的字�W�代码号的位所填充。这是能够代表被使用代码的最短的可能的多字节序列�?

UTF-8 �~�码�C�Z��

Unicode 字符版权标记字符 0xA9 = 1010 1001 �?UTF-8 �~�码如下所�C�：(x��)

11000010 10101001 = 0xC2 0xA9

“不�{�于”符号字�W?0x2260 = 0010 0010 0110 0000 �~�码如下所�C�：(x��)

11100010 10001001 10100000 = 0xE2 0x89 0xA0

通过获取 continuation byte 的值可以看到原始数据：(x��)

[1110]0010 [10]001001 [10]100000 0010 001001 100000 0010 0010 0110 0000 = 0x2260

�W�一个字节定义后面紧跟的八位元数�Q�如果是 7F 或更��，�q�就是等��L(f��ng)�� ASCII 倹{��每个八位字节以 10 xxxxxx 开��_(d��)��保字节不与 ASCII 的值�؜淆�?

回页�?/font>

UTF 支持

�?Linux �q�_��上��?UTF-8 之前�Q�请��信分发包里�?glibc 2.2 �?XFree86 4.0 或更新的版本。早先的版本�~�少 UTF-8 语言环境支持�?ISO10646-1 X11 字体�?/p>
�?UTF-8 发布之前�Q�Linux 用户使用各种不同特定语言的扩�?ASCII�Q�像�Ƨ洲用户�?ISO 8859-1 �?ISO 8859-2�Q�希腊用户��?ISO 8859-7�Q�俄�|�斯用户使用 KOI-8 / ISO 8859-5/CP1251�Q�西里尔字母�Q�。这使得数据交换出现了很多问题，�q�且需要�ؓ(f��)�q�些�~�码之间的差异编写应用��Y件。这�U�语�a�支持是不完善的，而且数据交换没有�l�过��试。Linux 主要的发行商和应用程序开发者正致力于让主要�?UTF-8 格式表示�?Unicode 成�ؓ(f��) Linux 中的标准�?/p>
��Z��识别 Unicode 文�g�Q�Microsoft ��所有的 Unicode 文�g应该�?ZERO WIDTH NOBREAK SPACE�Q�U+FEFF�Q�字�W�开头。这作�ؓ(f��)一个“特征符”或“字节顺序标讎ͼ�byte-order mark�Q�BOM�Q�”来识别文�g中��用的�~�码和字节顺序。但是，Linux/UNIX �q�没有��?BOM�Q�因为它�?x��)破坏现有�?ASCII 文�g的语法约定。在 POSIX �pȝ��中，选中的语�a�环境识别了在一个过�E�中的所有输入输出文件期望的�~�码形式�?/p>
有两�U�方法可以将 UTF-8 支持��d��?Linux 应用�E�序中。第一�U�方法，数据都以 UTF-8 形式存放在各处，�q�样软�g改动很少�Q�被动的�Q�。另一�U�方法，被读取的 UTF-8 数据用标准的 C 语言库函数�{变成为宽字符数组�Q��{换的�Q�。在输出�Ӟ��用函�?wcsrtombs() 使字�W�串被�{变回 UTF-8�Q?

清单 1. wcsrtombs()
#include  
size_t wcsrtombs (char *dest, const wchar_t **src, size_t len, mbstate_t *ps);
�Ҏ(gu��)��的选择取决于应用程序的性质。大多数应用�E�序可以使用被动的方法操作。这��是�?UNIX �q�_��上��?UTF-8 �?x��)如此流行的原因。像 cat �?echo 那样的程序就不需要修攏V��字节流仍只是字节流�Q��ƈ没有对它�q�行��M��处理。ASCII 字符和控制代码在 UTF-8 语言环境中不改变�?

通过字节计数对字�W�进行计数的�E�序需要一些小��的改动。在 UTF-8 中应用程序不对�Q何扩展的字节�q�行计数。如果选择�?UTF-8 语言环境�Q�C 语言库的 strlen(s) 函数需要用 mbstowcs() 函数来代替：(x��)

清单 2. mbstowcs() 函数
#include 
size_t mbstowcs(wchar_t *pwcs, const char *s, size_t n);
strlen 的一�U�常见用法是估算昄��宽度。中文和其它表意�W�号��占用两列位�|��?wcwidth() 函数用来��试每个字符的显�C�宽度：(x��)

清单 3. wcwidth() 函数
#include <
        wchar.h> 
int wcwidth(wchar_t wc);
      
回页�?/font>

Unicode �?C 语言支持

在正式情况下�Q�从 GNU glibc 2.2 开始，wchar_t �c�d��只�ؓ(f��) 32 位的 ISO 10646 格式数值所特定使用�Q�与当前使用的语�a�环境无关。通过 ISO C99 所要求�?__STDC_ISO_10646__ 宏的定义作�ؓ(f��)信号通知应用�E�序�?__STDC_ISO_10646__ 的定义用来指�?wchar_t �?Unicode。精��的值是一个十�q�制�?yyyymmL 格式的常数。例如，使用�Q?/p>
清单 4. 指出 wchar_t �?Unicode
#define __STDC_ISO_10646__ 200104L
是�ؓ(f��)指出 wchar_t �c�d��的值是�?ISO/IEC 10646 和到指定的年月�ؓ(f��)止的所有修正与技术勘误定义的字符�~�码表示�?/p>
�?wchar_t 的利用如�q�个�C�Z��所�C�，使用宏确定在 ISO C99 可移植代码中写双引号的方法�?/p>
清单 5. ��定写双引号的方�?/b>
#if __STDC_ISO_10646__  
   printf("%lc", 0x201c);  
#else  
   putchar('"');  
#fi
语言环境

�Ȁ�z?UTF-8 的恰当的办法�?POSIX 语言环境机制。语�a�环境是一�U�包含有兌��Y件行为特定文化约定的配置讑֮�。它包含了字�W�编码、日期／旉��W�号、分�c�规则以�?qi��ng)度量系�l�。语�a�环境的名�U�通常�?ISO 639-1 语言、ISO 3166-1 国家或地��Z��码以�?qi��ng)可选的�~�码名称和其它限定符�l�成。�?zh��n)�可以用命�?locale -a 获取所有安装在�pȝ��上的语言环境列表�Q�通常�?/usr/lib/locale/�Q��?

如果没有预安�?UTF-8 语言环境�Q�你可以�?localedef 命��o(h��)生成它。若要�ؓ(f��)某个特定用户生成�q�激�z�M��个�d语的 UTF-8 语言环境�Q�请使用如下语句�Q?

清单 6. 为特定用��L(f��ng)��成语�a�环境

localedef -v -c -i de_DE -f UTF-8 $HOME/local/locale/de_DE.UTF-8 export LOCPATH=$HOME/local/locale export LANG=de_DE.UTF-8

有时候�ؓ(f��)所有用��h��?UTF-8 语言环境�?x��)很有用。root 用户使用如下指��o(h��)��可以完成：(x��)

清单 7. 为每个用��L(f��ng)��成语�a�环境

localedef -v -c -i de_DE -f UTF-8 /usr/share/locale/de_DE.UTF-8

若要为每个用户将�q�个语言环境设�ؓ(f��)�~�省��|��可以��以下行��d��?/etc/profile 文�g中：(x��)

清单 8. 为所有用戯��|�缺省的语言环境

export LANG=de_DE.UTF-8

处理多字节字�W�代码序列的函数行�ؓ(f��)依赖于当前语�a�环境�?LC_CTYPE �c�d��Q�它��定了依赖语�a�环境的多字节�~�码。�?LANG=de_DE�Q��d语）�?x��)导致输出�?ISO 8859-1 被格式化。�?LANG=de_DE.UTF-8 �?x��)把输出格式化�?UTF-8。语�a�环境讄��?x��)导�?printf 中的 %ls 格式说明�W�调�?wcsrtombs() 函数以便于将宽字�W�的参数字符串�{换成依赖语言环境的多字节�~�码。语�a�环境中的国家或地区标识符如：(x��)LC_CTYPE= en_GB �Q�英国英语）�?LC_CTYPE= en_AU�Q�澳大利亚英语）�Q�它们之间的差异只在 LC_MONETARY �c�d��中，原因在于货币的名�U�和打印货币数量的规则不同�?

��L(f��ng)��(zh��n)�首选的语言环境讄��环境变量 LANG。当一�?C �E�序执行 setlocale() 函数�Ӟ��(x��)

清单 9. setlocale() 函数

#include #include //char *setlocale(int category, const char *locale); int main() { if (!setlocale(LC_CTYPE, "")) { fprintf(stderr, "Locale not specified. Check LANG, LC_CTYPE, LC_ALL. "); return 1; }

C 语言库将�?x��)依�ơ测试环境变�?LC_ALL、LC_CTYPE �?LANG。其中第一个含值的环境变量��决定�ؓ(f��) LC_CTYPE �c�d��装入哪种语言环境数据。语�a�环境数据分裂成独立的�c�d��。�?LC_CTYPE 定义了字�W�编码，�?LC_COLLATE 定义了排序顺序。我们用 LANG 环境变量为所有类别设�|�缺省语�a�环境�Q�但 LC_* 变量可以用来覆盖单个�c�d��?/p>
�(zh��n)�可以用命��o(h��) locale charmap 查询当前语言环境中字�W�编码的名称。如果�?zh��n)��?LC_CTYPE �c�d��中成功选取�?UTF-8 语言环境�Q�会(x��)输出 UTF-8。命�?locale -m 提供一张已安装的所有字�W�编码名�U�的列表�?

如果�(zh��n)��用专门的 C 语言库的多字节函数来完成所有外部字�W�编码和内部使用�?wchar_t �~�码之间的�{换，那么 C 语言库将承担责�Q�Q�根�?LC_CTYPE 使用正确的编码方式。这甚至不需要程序被明确的编码成当前的多字节�~�码�?/p>
如果需要一个应用程序能明确的支�?UTF-8�Q�或其它�~�码�Q��{换方法而不�?libc 多字节函敎ͼ�则应用程序必��ȝ��定是否需要激�z?UTF-8 模式。带�? 库头文�g的与 X/Open 兼容�pȝ��可以用如下代码：(x��)

清单 10. ��当前的语言环境是否使用�?UTF-8 �~�码

BOOL utf8_mode = FALSE; if( ! strcmp(nl_langinfo(CODESET), "UTF-8") utf8_mode = TRUE;

为检��当前语�a�环境是否使用�?UTF-8 �~�码。首先必��调�?setlocale(LC_CTYPE, "") 函数�Q�依据环境变量设�|�语�a�环境。nl_langinfo(CODESET) 函数也是�?locale charmap 命��o(h��)调用�Q�从而查扑ֽ�前语�a�环境指定的编码名�U��?

另一�U�可以��用的�Ҏ(gu��)��是查询语�a�环境变量�Q?/p>
清单 11. 查询语言环境变量

char *s; BOOL utf8_mode = FALSE; if ((s = getenv("LC_ALL")) || (s = getenv("LC_CTYPE")) || (s = getenv ("LANG"))) { if (strstr(s, "UTF-8")) utf8_mode = TRUE; }

�q�项��试假设 UTF-8 语言环境名称中有值“UTF-8”，但实际情况�ƈ不��L��如此�Q�所以应该��?nl_langinfo() �Ҏ(gu��)��?

回页�?/font>

�ȝ��

为支持世界上的所有语�a��Q�需要一�U�具有八位字节字�W�编码策略的字符�~�码�pȝ��Q�它的字�W�应多于 ASCII�Q�一�U��用无�W�号字节的扩展版本）�?2^8 = 256 个字�W�。Unicode ��是�q�样一�U�字�W�编码系�l�，它具有由 128 个三�l�组�Q�带有由大量字符�~�码�Ҏ(gu��)��的方法支持的 94,140 个定义好的字�W��|��l�成的四�l�编码空��_(d��)��?Linux 中更��行的字�W�编码方案是 Unicode 转换格式 UTF-8�?/p>

参考资�?

�(zh��n)�可以参阅本文在 developerWorks 全球站点上的英文原文.

误��?Unicode 联盟�?Unicode 主页�Q�这里定义了 Unicode 字符之间的行为和关系�Q��ƈ为实现者提供了技术信息�?

国际标准�l�织�Q�International Organization for Standardization�Q�ISO�Q?/font> 是一个由 140 个国家组成的全球性的国家标准�C�֛�联盟�?

ANSI 是个�U�有的、非营利�l�织�Q�它��理�q�调�?U.S. 的志愿标准化以及(qi��ng)一致性评��L(f��ng)��l��?

ISO C99 Draft �Q�Acrobat PDF 格式�Q?56 ��）�Q�是新的 C 语言标准�Q�来�?Calgary 大学 Ben �?C �~�程评��?

请阅�?Roman Czyborra �?Unix 环境下的 Unicode�?

请阅�?IANA�Q�Internet Assigned Numbers Authority�Q?/font>中的 IANA Charset Registration Procedures�?

请参�?Virginia 大学图书�?Robertson Media 中心�?Unicode Music Symbols�?

��L(f��ng)��?graphic representation of the Roadmap to the BMP, Plane 0 of the UCS。这些表包含了由 0 ��P��也就是通用字符集（Universal Character Set�Q�UCS�Q�的基本多语�a��q�面�Q�Basic Multilingual Plane�Q�BMP�Q�实际大��的映射�l�成的。Everson Gunn Teoranta 是一个自 1990 �q�开办的支持��数民族语言团体的��Y件和出版公司�Q�由 Michael Everson �?Marion Gunn 共同建立�?

��h��?UTF-8 and Unicode FAQ for UNIX/Linux�Q�Markus Kuhn 的综合性的 one-stop 信息资源�Q�关于�?zh��n)�如何�?POSIX �pȝ��Q�Linux�Q�UNIX�Q��?Unicode/UTF-8�?

��h��?Technology Appraisals Ltd �?Solution Given by the Universal Character Set�Q�其中提供了独立的、高质量的有关电(sh��)子商务系�l�、电(sh��)子信息传递、XML、网�l�和 IT 安全的信息、教育和培训�?

请阅�?Mulberry Technologies, Inc �?Unicode presentation titled�?0646 and All That�?/font>�Q�一个专��d��?SGML �?XML �pȝ��的电(sh��)子出版物的咨询公司�?

请咨�?Linux �E�序员手册上�?UTF-8 �?an ASCII compatible multi-byte Unicode encoding�?

请阅�?Unicode Standard Annex#15 Unicode Normalization Forms�Q�一��描写了四种 Unicode 文本标准化格式规范的文档。有了这些格式，�{��h(hu��n)的（规范或是兼容的）文本��会(x��)有同��L(f��ng)��二进制表式。当实现工具在标准化的格式中保留了一个字�W�串�Q�可以确保有一个以二进制�Ş式表现的独一无二的等价字�W�串�?

请阅�?man-pages.net 上的 mbstowcs�Q�它把多字节字符串�{换成了宽字符的字�W�串�Q�man-pages.net �?Linux 手册��面提供了永久的��Z�� Web 的归档文件�?

请阅�?Hewlett Packard 的开发者资源站点的 Linux �E�序员手册上�?wcsrtombs�Q�它能将宽字�W�的字符串�{化�ؓ(f��)多字节字�W�串�?

请阅�?MKS 工具��文档中�?setlocale()�Q�它能改变或查询语言环境。MKS 软�g公司是在 Windows 环境或�؜�?UNIX/Linux �?Windows 环境中用于系�l�管理和开发的 Windows 自动化工��L(f��ng)��领先供应商�?

请学�?IBM Classes for Unicode (ICU)�Q�一�?C 语言�?C++ 语言库，它在许多�q�_��上提供了健壮的和功能完善�?Unicode 支持�?

请参�?IBM �?“Introduction to Unicode”站�?/font>�Q�这里深入涵盖了 Unicode 基础知识�?

�?IBM 的关于新兴技术的 alphaWorks站点。请参阅�Q?
UnicodeCompressor�Q�这里提供了使用标准 Unicode 压羃�Ҏ(gu��)��的压�~�和解压�~?Unicode 文本的工�?
Unicode Normalizer�Q��ؓ(f��)实现快速排序和搜烦��?Java 字符串对象�{换�ؓ(f��)标准 Unicode 格式�?

请阅�?TW Burger 撰写�?“Cyrillic in Unicode�?/font>�?Jim Melnick 撰写�?“Multilingual forms in Unicode�?/font>�Q�也�?developerWorks上�?

请在 developerWorks上浏�?更多 Linux 参考资�?/font>�?

关于作�?/span>

TW Burger �?1979 �q��v曄��做过�~�程、讲授中�{�计��机评��以及(qi��ng)撰写有关计算机技术方面的书。他正在�l�营一个信息技术咨询公司。�?zh��n)�可以通过 twburger@bigfoot.com 与他联系�?

archangel 2007-08-31 19:37 发表评论

av播放在线,在线资源免费观看,国产精品入口免费视

Linux Unicode �~�程

Linux Unicode �~�程

如何修改linux�pȝ��旉��

Linux旉��

Solaris多线�E?1)

0x00000000 - 0x0000007F:		0 xxxxxxx
0x00000080 - 0x000007FF:		110 xxxxx10 xxxxxx
0x00000800 - 0x0000FFFF:		1110 xxxx10 xxxxxx10 xxxxxx
0x00010000 - 0x001FFFFF:		11110 xxx10 xxxxxx10 xxxxxx 10 xxxxxx
0x00200000 - 0x03FFFFFF:		111110 xx10 xxxxxx10 xxxxxx10 xxxxxx 10 xxxxxx
0x04000000 - 0x7FFFFFFF:		1111110 x10 xxxxxx10 xxxxxx10 xxxxxx 10 xxxxxx10 xxxxxx


		TW Burger �?1979 �q��v曄��做过�~�程、讲授中�{�计��机评��以及(qi��ng)撰写有关计算机技术方面的书。他正在�l�营一个信息技术咨询公司。�?zh��n)�可以通过 twburger@bigfoot.com 与他联系�?

av播放在线,在线资源免费观看,国产精品入口免费视

Linux Unicode �~�程

Linux Unicode �~�程

如何修改linux�pȝ��旉���

Linux旉���

Solaris多线�E?1)

如何修改linux�pȝ��旉��

Linux旉��