字符集ASCII、GBK、UNICODE、UTF在储存字符时的区别有哪些

60次阅读
没有评论

共计 916 个字符,预计需要花费 3 分钟才能阅读完成。

这篇文章主要介绍了 字符集 ASCII、GBK、UNICODE、UTF 在储存字符时的区别有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让丸趣 TV 小编带着大家一起了解一下。

ASCII 编码(American Standard Code for Information Interchange,美国信息互换标准代码),使用 127 个 8 进制字节表示英文和半角字符。
GBK(Guo Biao Kuozhan,国标扩展),当在 ASCII 码的范围时,就用一个字节表示,然后每两个字节表示一个汉语和全角字符。
UCS(Universal Multiple-Octet Coded Character Set)俗称 UNICODE,所有的字符都是两个字节。ASCII 字符前面全部补零,其他字符重新编码。
UTF(UCS Transfer Format,万国码),当在 ASCII 码的范围时,就用一个字节表示,一个中 文字符占 3 个字节,从 unicode 到 uft- 8 并不是直接的对应。

中英文各字符集十进制编码对照表

字符 ASCIIGBKUNICODEUTF8a97979797 阿无 452183846315308991

中英文各字符集二进制编码对照表

字符 ASCIIGBKUNICODEUTF8a0110000101100001000000000110000101100001 阿无 10110000101000101001011000111111111010011001100010111111

从第一个表中,我们可以看出英文字符(更准确的来说是 ASCII 字符集的字符)编码顺序没有改变,中文字符则都做了从新的编排。
从第二个表中,我们很容易看出,四种字符编码集对英文字符的处理除了“UNICODE”用两个字节,其他都是使用一个字节来表示。对于中文字符,“GBK”和“UNICODE”使用两个字节来表示,UTF8 使用三个字节来表示。

感谢你能够认真阅读完这篇文章,希望丸趣 TV 小编分享的“字符集 ASCII、GBK、UNICODE、UTF 在储存字符时的区别有哪些”这篇文章对大家有帮助,同时也希望大家多多支持丸趣 TV,关注丸趣 TV 行业资讯频道,更多相关知识等着你来学习!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-08-25发表,共计916字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)