共计 3787 个字符,预计需要花费 10 分钟才能阅读完成。
这期内容当中丸趣 TV 小编将会给大家带来有关如何进行 mysql 乱码产生的探讨,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
实验一
1。首先,在下面情况下:
mysql show variables like character_set_%
+————————–+—————————————+
| Variable_name | Value |
+————————–+—————————————+
| character_set_client | latin1 |
| character_set_connection | latin1 |
| character_set_database | latin1 |
| character_set_filesystem | binary |
| character_set_results | latin1 |
| character_set_server | latin1 |
| character_set_system | utf8 |
| character_sets_dir | D:\Programs\mysql5045\share\charsets\ |
+————————–+—————————————+
建表,并加入 3 个记录:大,阿,爱
2。set character_set_results=utf8;
则显示:(cmd 窗口中,cmd 窗口代码页 936)
大 - 麓贸
阿 - 掳垄
爱 - 掳庐
分析编码:
大 U:5927,GBK:B4F3
麓 U:9E93,GBK:C2B4
贸 U:8D38,GBK:C3B3
阿 U:963F,GBK:B0A2
掳 U:63B3,GBK:C2B0
垄 U:5784,GBK:C2A2
爱 U:7231,GBK:B0AE
掳 U:63B3,GBK:C2B0
庐 U:5E90,GBK:C2AE
3。改成 set character_set_results=gb2312;
一样是乱码
4。结论:
乱码的产生,是由于单字节向多字节扩展引起的。B0A2 如果作为单字节存储(虽然表示的是 1 个汉字,但是因为是 latin1 单字节,所以认为 B0A2 是不相关的两个字符),此时如果把 character_set_results 变成 utf8 多字节,那么数据库 mysql 会试图把每个单字节扩展成近似的(不知道具体的算法)双字节。所以乱码
反之,多字节向单字节转换时,不会有变动,仅仅是原来 2 各字节表示的一个字符 lsquo;B0A2 rsquo; 变成了表示两个字符而已。—- 这个说法经验证是错误的。
数据库存储的内容(磁盘上,内存里)不会受 character_set_的影响,只是提交,查询的过程中,受到字符集转换的影响。
实验二
1。
create table y (id int, name char(4)) default charset gb2312;
2。在不改变默认 character_set_ 是 latin1 的情况下,如果插入一个汉字,则显示乱码
3。改成 set names gb2312,显示没问题 (cmd 窗口中,cmd 窗口代码页 936)
4。我原以为如上述实验 1 种的结论 2,“多字节向单字节转换时,不会有变动”。所以我开始以为,set names gb2312 后,把 character_set_results 改成 latin1,显示不会出问题。结果,
一个汉字,则显示一个问号;两个汉字,则显示两个问号的乱码(估计一个问号代表一个字符)。也就是说,改成 character_set_results = latin1 后,多字节的数据存储,在向单字节表示转换时,mysql 把提出的信息“缩水了”,把两个字节,换算成了一个字节。
5。如何,不让 mysql 缩水呢,我想到了 character_set_results = binary;结果,果然显示正常。
PS
开发的使用 mysql 的应用程序,是对应作为独立的使用自己的 character_set_client 的字符集的
cmd 窗口登陆 mysql,也是作为一个独立的,拥有自己 character_set_client 变量的应用
同理,打开不同的 cmd 窗口,都拥有独自的 character_set_client 变量
实验三 07/16/2010
1。建一个默认字符集 utf8 的表(用 navicat,在 utf8 的界面下 代码页 65001),并且插入 utf8 编码的汉字; 大学;
2。切换到 mysql console(代码页 936)
3。set names gbk; 然后显示刚才所建立的表,能正确现实吗?—- 能!当然,只把 character_set_results 成 gbk,也能正常显示
实验四
1。mysql console(代码页 936)建立一个表 x3 (name char(32) ),默认字符集 default charset gbk;
2。默认环境变量
| character_set_client | latin1
| character_set_connection | latin1
| character_set_database | latin1
| character_set_filesystem | binary
| character_set_results | latin1
| character_set_server | latin1
| character_set_system |utf8 // 不知道对以下过程、分析是否有影响
character_set_client character_set_connection character_set_results 是 latin1 的情况下,插入数据:insert x3 values(大
显示:ERROR 1406 (22001): Data too long for column name at row 1
3。set character_set_client=gbk; 然后 insert x3 values(大 插入没有问题,但显然,数据经过(character_set_connection=latin1)的转换,已经是有损了
4。不管 character_set_results 设不设成 gbk,都不能正常显示结果
5。set names gbk;则插入现实都没问题。并且此时,一个 uf8 字符集的表的显示也没问题(实验三)。而且进行连接查询,亦没问题。
6。当然,set names utf8,如果在一个 utf8 的软件界面上,显示输出也没问题 (navicat 验证了)
7。如果设成 set names binary。在 936 代码页的显示界面上,可以看到,x3 依然可以正常现实;但像实验三那样建的表就不能正常显示了。
——–
分析第 2 点:Data too long for column name at row 1
我的 char 够长,插入数据够短,所以不是数据太长了。也就是说这个提示是错误的。
我知道,如果表 x3 默认字符集 是 latin1 的话,插入是没问题的(一直以来都是这么玩的);这是因为,虽然输入端 mysql console 代码页是 936,但因为三个主环境变量 character_set_c% 都是 latin1,所以,mysql 认为 insert x3 values(大) 输入的是 2 个字符 (当然, 如果从 utf8 界面输入,可能就认为是输入 3 个字符)。存储的自然也是 2 个字符。显示的时候也是显示的 2 个字符,只不过 936 代码页把这两个字符自然组合,显示成汉字了(早期环境常见现象)。
当默认字符集变为 gbk 的时候,发生了什么?不知道。。。。。
实验五
一个很狗屎的问题出现了:936 console
环境变量如 实验一.1。
mysql set names latin1;
Query OK, 0 rows affected (0.00 sec)
mysql create table x4 (
– name char(32) primary key);
Query OK, 0 rows affected (0.09 sec)
mysql drop table x4;
Query OK, 0 rows affected (0.06 sec)
mysql create table x4 (
– name char(32) primary key) default charset utf8;
Query OK, 0 rows affected (0.10 sec)
mysql insert x4 values(乃
Query OK, 1 row affected (0.04 sec)
mysql create table x5 (
– name char(32) primary key) default charset gbk;
Query OK, 0 rows affected (0.09 sec)
mysql insert x5 values(乃
ERROR 1406 (22001): Data too long for column name at row 1
mysql
结论,我实在对实验四中分析的第 3 点做出结论。character_set_system utf8 有关~~
上述就是丸趣 TV 小编为大家分享的如何进行 mysql 乱码产生的探讨了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注丸趣 TV 行业资讯频道。