Mysql 数据库字�W�集转换

Thu, 13 Nov 2008 02:56:00 GMT

最�q�discuz发布了新的版本，免费了，用的人更多了�Q�以前��用其它论坛程序和discuz2.5/3.0的纷�U��{换或升��到discuz4.0�Q�可见discuz作�ؓ中国人开发的PHP论坛�E�序�Q�确实是非常优秀的，在大家欣喜若狂的时候，也遇��C��一些问�?
看到不少用户反映转换完以后是��q��的情�?出现�q�种现象的主要原因是�q�类用户使用的都是MySQL4.1以上的版�?下面作一个说�?希望出现�q�个问题的朋友都能耐心的把�q�个文档看完!!!
MySQL 4.1开始，对多语言的支持有了很大变�?(�q�导致了问题的出�?。尽��大部分的地�?(包括个�h使用和主机提供商)�Q�MySQL 3�?.0 仍然占主导地位；�?MySQL 4.1 乃至5.0�?MySQL 官方推荐的数据库�Q�已�l�有��L��提供商开始提供�ƈ��会��来��多�Q�因�?latin1 在许多地�?(下边会详�l�描�q�具体是哪些地方) 作�ؓ默认的字�W�集�Q�成功的蒙蔽了许�?PHP �E�序的开发者和用户�Q�掩盖了在中文等语言环境下会出现的问题�?
MySQL 4.1开始把多国语言字符集分的更加详�l�，所以导致数据库�q�移�Q�或则dz论坛升��?.0后（dz4.0开始��用gbk或utf-8�~�码�Q�出��Cؕ码问题�?
MySQL 4.1的字�W�集支持(Character Set Support)有两个方面：字符�?Character set)和排序方�?Collation)。对于字�W�集的支持细化到四个层次: 服务�?server)�Q�数据库(database)�Q�数据表(table)和连�?connection)�?
查看�pȝ��的字�W�集和排序方式的讑֮�可以通过下面的两条命令：

QUOTE:
MySQL> SHOW VARIABLES LIKE 'character_set_%';
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | latin1 |
| character_set_connection | latin1 |
| character_set_database | latin1 |
| character_set_results | latin1 |
| character_set_server | latin1 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/MySQL/charsets/ |
+--------------------------+----------------------------+
7 rows in set (0.00 sec)
MySQL> SHOW VARIABLES LIKE 'collation_%';
+----------------------+-------------------+
| Variable_name | Value |
+----------------------+-------------------+
| collation_connection | latin1_swedish_ci |
| collation_database | latin1_swedish_ci |
| collation_server | latin1_swedish_ci |
+----------------------+-------------------+
3 rows in set (0.00 sec)
MySQL 4.1 对于字符集的指定可以�l�化��C��台机器上安装�?MySQL�Q�其中的一个数据库�Q�其中的一张表�Q�其中的一栏，应该用什么字�W�集。但是，传统�?Web �E�序在创建数据库和数据表时�ƈ没有使用那么复杂的配�|�，它们用的是默认的配置�Q�那么，默认的配�|�从何而来呢？
�~�译 MySQL �Ӟ��指定了一个默认的字符集，�q�个字符集是 latin1�Q?
安装 MySQL �Ӟ��可以在配�|�文�?(my.ini) 中指定一个默认的的字�W�集�Q�如果没指定�Q�这个值��承自�~�译时指定的�Q?
启动 MySQLd �Ӟ��可以在命令行参数中指定一个默认的的字�W�集�Q�如果没指定�Q�这个值��承自配置文�g中的�Q?
此时 character_set_server 被设定�ؓ�q�个默认的字�W�集�Q?
当创��Z��个新的数据库�Ӟ��除非明确指定�Q�这个数据库的字�W�集被缺省设定�ؓ character_set_server�Q?
当选定了一个数据库�Ӟ��character_set_database 被设定�ؓ�q�个数据库默认的字符集；
在这个数据库里创��Z��张表�Ӟ��表默认的字符集被讑֮��?character_set_database�Q�也��是�q�个数据库默认的字符集；
当在表内讄��一栏时�Q�除非明��指定，否则此栏�~�省的字�W�集��是表默认的字符集；
�q�个字符集就是数据库中实际存储数据采用的字符集，MySQLdump 出来的内容就是这个字�W�集下的�Q?
当我们按照原来的方式通过PHP存取MySQL数据库时�Q�就��设�|�了表的默认字符集�ؓutf8�q�且通过UTF-8�~�码发送查询，你会发现存入数据库的仍然是�ؕ码。问题就出在�q�个connection�q�接层上�?br /> 惌��q�行“正确”的存储和得到“正确”的结果，最方便的是在所有query开始之前执行一下：
SET NAMES 'gbk';
其中gbk是数据库字符集�?
它相当于下面的三句指令：
SET character_set_client = gbk;
SET character_set_results = gbk;
SET character_set_connection = gbk;
4.1�?.0默认使用的是latin1字符�?木头:妈的,老外真霸�?妄想让全世界都是使用瑞典字符集吗)
如果我们只想使用gbk字符集存储和获取数据,
我们在编译MySQL 4.1�?5.0的时候，需要注意在my.ini或者my.cnf中添加两处参�?

[Copy to clipboard] [ - ]
CODE:
[MySQLd]
default-character-set=utf8

[Copy to clipboard] [ - ]
CODE:
#settings for clients (connection, results, clients)
[MySQL]
default-character-set=utf8
下面我们来说主题�Q�如何�{换数据库字符�?br /> 两种�Ҏ��Q?

QUOTE:
�W�一�U?---更改存储字符�?br /> 主要的思想��是把数据库的字�W�集有latin1改�ؓgbk�Q�big5,或者utf8; 以下操作必须拥有��L��权限。假讑ֽ�前操作的数据库名为：database
导出
首先需要把数据��gؓMySQL4.0的格式，具体的命令如下：
MySQLdump -uroot -p --default-character-set=latin1 --set-charset=gbk --skip-opt databse > d4.sql
--default-characte-set 以前数据库的字符集，�q�个一般情况下都是latin1的，
--set-charset 导出的数据的字符集，�q�个可以讄��为gbk�Q�utf8,或者big5
导入
首先使用下面语句新徏一个GBK字符集的数据库（test�Q?
CREATE DATABASE `d4` DEFAULT CHARACTER SET gbk COLLATE gbk_chinese_ci;
然后把刚才导出的数据导入到当前的数据库中��ok了�?
MySQL -uroot -p --default-character-set=gbk -f d4 通过以上的导出和导入��把数据库的字符集改为正��的存储方式了�?
其中d4为新建库的名�U�ͼ�d4.sql为导出文件的名字
但是�q�种�Ҏ��Q�发现数据库数据存储量无端变�?0%�Q�真是郁�?nbsp;

QUOTE:
另外一�U�其实原理相同，但是需要手动操作，一般用于第一�U�方法失败后的选择
不过�q�种�Ҏ��如果数据库很大，估计很难做，因�ؓ光打开文�g��p��让你��L��
首先�q�是用PHPmyadmin或者用MySQL本��n的dump导出 .sql文�g
然后用UltraEdit打开你备份的所有xxxx.sql文�g�Q�查�?

[Copy to clipboard] [ - ]
CODE:
DEFAULT CHARSET=latin1
latin1�q�里也许是别的，反正是你不想要的�Q�要转成gbk或者big5的字�W�集
把这个替换�ؓ“�I?#8221;
在查�?

[Copy to clipboard] [ - ]
CODE:
CREATE TABLE cdb_sessions (
sid char(6) character set latin1 collate latin1_bin NOT NULL default '',
ip1 tinyint(3) unsigned NOT NULL default '0',
ip2 tinyint(3) unsigned NOT NULL default '0',
ip3 tinyint(3) unsigned NOT NULL default '0',
ip4 tinyint(3) unsigned NOT NULL default '0',
uid mediumint(8) unsigned NOT NULL default '0',
username char(15) NOT NULL default '',
groupid smallint(6) unsigned NOT NULL default '0',
styleid smallint(6) unsigned NOT NULL default '0',
invisible tinyint(1) NOT NULL default '0',
`action` tinyint(1) unsigned NOT NULL default '0',
lastactivity int(10) unsigned NOT NULL default '0',
fid smallint(6) unsigned NOT NULL default '0',
tid mediumint(8) unsigned NOT NULL default '0',
nickname char(15) NOT NULL default '',
UNIQUE KEY sid (sid)
) ENGINE=HEAP MAX_ROWS=1000;
替换�?

[Copy to clipboard] [ - ]
CODE:
CREATE TABLE `cdb_sessions` (
`sid` char(6) binary NOT NULL default '',
`ip1` tinyint(3) unsigned NOT NULL default '0',
`ip2` tinyint(3) unsigned NOT NULL default '0',
`ip3` tinyint(3) unsigned NOT NULL default '0',
`ip4` tinyint(3) unsigned NOT NULL default '0',
`uid` mediumint(8) unsigned NOT NULL default '0',
`username` char(15) NOT NULL default '',
`groupid` smallint(6) unsigned NOT NULL default '0',
`styleid` smallint(6) unsigned NOT NULL default '0',
`invisible` tinyint(1) NOT NULL default '0',
`action` tinyint(1) unsigned NOT NULL default '0',
`lastactivity` int(10) unsigned NOT NULL default '0',
`fid` smallint(6) unsigned NOT NULL default '0',
`tid` mediumint(8) unsigned NOT NULL default '0',
`nickname` char(15) NOT NULL default '',
UNIQUE KEY `sid` (`sid`)
) TYPE=HEAP MAX_ROWS=2000;
�q�一步更为简单的办法��是删除掉关于cdb_sessions表的�q�一�D�，��来全新装一个d4�Q�将�q�个表导�?br /> ��其内容复制�Q�粘贴到 sql文�g的最后面
保存后，再把�q�个sql文�g导入��C��的库�?
��OK�?
用这两种�Ҏ��可以很方便的把4.1�?.0的MySQL数据库降�U�到4.0
��单的�q�程��是
A导出4.1/5.0的库
B�q�行处理�Q��{换成gbk字符�?br /> C��d��卸蝲4.1或�?.0
D安装4.0.26
E然后导入处理完的�?
降��的时候导出库可以用这个方�?br /> mysqldump -uroot -p --default-character-set=latin1 --set-charset=gbk --skip-opt databse --compatible=MySQL40 > d4.sql
�q�样导出的就�?.0的库�?
至于MySQL版本的升�U�，
如果数据文�g中有中文信息�Q�那么将MySQL 4.0的数据文�Ӟ��直接拯��到MySQL 4.1中就是不可以的，即便在my.ini中设�|�了default-character-set为正��的字符集。虽然貌似没有问题，但MySQL 4.1的字�W�集有一处非常恼人的地方�Q�以gbk��Z��Q�原本MySQL 4.0数据中varchar,char�{�长度都会变为原来的一半，�q�样存储中文定w��不变�Q�而英文的存储定w��少了一半。这是直接拷贝数据文件带来的最大问题�?
所以，升��的根本，如果想��?#8220;正确”的字�W�集�Q�还是先用MySQLdump导出成文�Ӟ��然后导入�?/font>

J2EE Home工作�?/a> 2008-11-13 10:56 发表评论

亚洲一区二区久久久久久,成人午夜av,国产精品久久久久久久久久久新郎

Mysql 数据库字�W�集转换