MySQL支持emoji图标存储的案例

63次阅读
没有评论

共计 3098 个字符,预计需要花费 8 分钟才能阅读完成。

自动写代码机器人,免费开通

丸趣 TV 小编给大家分享一下 MySQL 支持 emoji 图标存储的案例,希望大家阅读完这篇文章后大所收获,下面让我们一起去探讨吧!

在 MySLQ 中 UPDATA 和 INSERT 数据的时候,如果数据上面带有 emoji 图标,例如:?、?、? 很容易更新或者插入不成功,导致报错。

Error: ER_TRUNCATED_WRONG_VALUE_FOR_FIELD: 
Incorrect string value: \xF0\x9F\x91\xBD\xF0\x9F... for column name at row

都快崩溃了,但是还好终于解决了这种鬼问题。资料显示原因是,MYSQL 5.5 之前,UTF8 编码只支持 1 - 3 个字节,只支持 BMP 这部分的 unicode 编码区,而 emoji 图标恰好是 4 个字节的编码进行存储。从 MYSQL5.5 开始,可支持 4 个字节 UTF 编码 utf8mb4,一个字符最多能有 4 字节,所以能支持更多的字符集。所以要解决问题,必需把数据库表字符编码全部改成 utf8mb4。

常用字符集

ASCII:美国信息互换标准编码;英语和其他西欧语言;单字节编码,7 位表示一个字符,共 128 字符。

GBK:双字节,汉字内码扩展规范;中日韩汉字、英文、数字;双字节编码;共收录了 21003 个汉字,GB2312 的扩展。

UTF-8:Unicode 标准的可变长度字符编码;Unicode 标准(统一码),业界统一标准,包括世界上数十种文字的系统;

UTF-8:使用一至三个字节为每个字符编码。

utf8mb4:存储四个字节,应用场景用于存储 emoji 表情,因为可以 emoji 表情四个字节。

utf8mb4:MySQL 版本 5.5.3。

其他常见字符集:UTF-32,UTF-16,Big5,latin1

数据库中的字符集包含两层含义

各种文字和符号的集合,包括各国家文字、标点符号、图形符号、数字等。

字符的编码方式,即二进制数据与字符的映射规则。

系统环境

MySQL 5.7.14

Mac OSX 10.11.6

首先备份

升级数据之前备份您服务器上的所有数据,保持良好习惯,安全第一!

升级您的 MySQL

新的数据库可以在这里下载 Upgrade the MySQL server to v5.5.3+。

修改您的数据库、表、字段

# 对每一个数据库:
ALTER DATABASE 这里数据库名字 CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;
# 对每一个表:
ALTER TABLE 这里是表名字 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
# 对每一个字段:
ALTER TABLE 这里是表名字 CHANGE 字段名字 重复字段名字 VARCHAR(191) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
# 上面一句或者使用 modify 来更改
ALTER TABLE 这里是表名字 modify 字段名字 VARCHAR(50) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci DEFAULT

utf8mb4 完全向后兼容 utf8,无乱码或其他数据丢失的形式出现。理论上是可以放心修改,如果您不放心修改,您可以拿备份恢复数据,然后让程序员处理这种兼容 emoji 存储问题,存的时候过滤一遍转成 base64,然后取的时候转回来?… 还是修改数据库比较方便。

检查你的字段和索引

不要将所有的都设置成 utf8mb4,这个冒得必要。我只在我某些字段类型为 VARCHAR 的时候才设置成 utf8mb4。

修改 MySQL 配置文件

这个地方最坑,我在我 Mac osx 系统上找不到 /etc/my.cnf 它根本不存在,所以我们需要创建这样一个文件并修改它。

# 进入这个目录,# 在这个目录下面有个后缀为 `.cnf` 的文件
cd /usr/local/mysql/support-files/
# 将这个文件复制到 `etc` 目录中并将名字命名为 `my.cnf`
sudo cp my-default.cnf /etc/my.cnf
# 然后编辑 `my.cnf` 文件,将下面内容复制到里面。sudo vim /etc/my.cnf

MySQL configuration file (/etc/my.cnf):

[client]
default-character-set = utf8mb4
[mysql]
default-character-set = utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci

重启 MySQL

重启步骤很重要,不然没有任何效果。

启动:/usr/local/mysql/support-files/mysql.server start

停止:/usr/local/mysql/support-files/mysql.server stop

重启:/usr/local/mysql/support-files/mysql.server restart

系统中可以以这种形式重启、停止或启动

service mysqld stop
service mysqld start
service mysqld restart

查看是否设置成功

通过下面命令查询是否设置成功!

# 登陆 MySQL 进行查询
mysql SHOW VARIABLES WHERE Variable_name LIKE character\_set\_% OR Variable_name LIKE collation% 
# 运行上面代码显示下面结果
# +--------------------------+--------------------+
# | Variable_name | Value |
# +--------------------------+--------------------+
# | character_set_client | utf8mb4 |
# | character_set_connection | utf8mb4 |
# | character_set_database | utf8mb4 |
# | character_set_filesystem | binary |
# | character_set_results | utf8mb4 |
# | character_set_server | utf8mb4 |
# | character_set_system | utf8 |
# | collation_connection | utf8mb4_unicode_ci |
# | collation_database | utf8mb4_unicode_ci |
# | collation_server | utf8mb4_unicode_ci |
# +--------------------------+--------------------+
# 查看表的情况
mysql SHOW FULL COLUMNS FROM users_profile;

到这一步表示你成功了!恭喜你!~

修复和优化表

我跑到这一步其实没有任何必要修复和优化表,为了保险起见,我还是运行了这两条命令,虽然不知道它有什么卵用,放在这里做个笔记吧。

REPAIR TABLE 表名字;
OPTIMIZE TABLE 表名字;

看完了这篇文章,相信你对 MySQL 支持 emoji 图标存储的案例有了一定的了解,想了解更多相关知识,欢迎关注丸趣 TV 行业资讯频道,感谢各位的阅读!

向 AI 问一下细节

丸趣 TV 网 – 提供最优质的资源集合!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-12-18发表,共计3098字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)