MySQL中怎么存储emoji

53次阅读
没有评论

共计 1569 个字符,预计需要花费 4 分钟才能阅读完成。

自动写代码机器人,免费开通

MySQL 中怎么存储 emoji,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

使用 erlang 存储一些特殊字符串到 MySQL 的时候,却没法读出来。经检查,这些字符串的二进制格式如下:

240,159,152,134,240,159,152,144

查看二进制的 unicode 是什么?

14  unicode:characters_to_list(240,159,152,134,240,159,152,144). [128518,128528] 15  erlang:integer_to_list(128518,16).%% 查看十六进制   1F606  16  erlang:integer_to_list(128528,16).  1F610 

明显,1F606 和 1F610 超过了常见 unicode 字符串 0000-FFFF 的表达范围。

这里引用资料:http://cenalulu.github.io/linux/character-encoding/

1F606 和 1F610 代表什么?

根据 unicode 官网上的说明,这是一种 emoji(表情符号),具体的展示形式与厂商有关。

MySQL 上存储失败的原因

目前来说,多数 MySQL 都是以 utf8 存储,注意 MySQL 的 utf8 和我们所说的传统 utf8 有点区别。MySQL 的 utf8   编码规定了最多只能有 3 个字节,而 emoji 的 unicode 已经超过了 3 个字节,因此 MySQL 的 utf8 无法识别与存储  emoji。

为此可以查阅 MySQL 中关于 unicode 支持的资料,从中可以得知 MySQL 在 5.5 后开始支持 utf8mb4,这种编码支持 1 ~ 4   个字节,这种编码可以表示 emoji。

另外 utf8mb4 向下兼容 utf8。

关于 unicode 与 utf8   的详细介绍,请查看:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

解决方案

将 MySQL 中对应的字段改成 utf8mb4 编码:

ALTER TABLE t1 DEFAULT CHARACTER SET utf8mb4, MODIFY col1 CHAR(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL, MODIFY col2 CHAR(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin NOT NULL;

参考:http://dev.mysql.com/doc/refman/5.5/en/charset-unicode-upgrading.html

将连接库的连接编码改为 utf8mb4,以 erlang 的连接库 emysql 为例:

emysql:add_pool(pool,[{size,1},{user, user},{password, password},{host, host},{port,3306},{encoding,utf8mb4}]). %% 或者  emysql:add_pool(pool,1, user , password , host ,3306,undefined, utf8mb4).

为了建表方便,可以修改 my.cnf:

#  服务器字符集  [mysql] default-character-set=utf8mb4 [mysqld] character-set-server=utf8mb4

关于 MySQL 中怎么存储 emoji 问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注丸趣 TV 行业资讯频道了解更多相关知识。

向 AI 问一下细节

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-12-04发表,共计1569字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)