全国服务热线:400-6263-721

位置:佛山童程童美信息学编程学习机构 > 学校动态 > 信息学奥赛编程知识 Unicode编码

信息学奥赛编程知识 Unicode编码

来源:佛山童程童美信息学编程学习机构时间:2023/12/6 16:28:32

  世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。因此,要想打开一个文本文件,就必须知道它的编码方式,否则用错误的编码方式解读,就会出现乱码,因此Unicode应运而生。

  Unicode,就像它的名字都表示的,这是一种所有符号的编码,将世界上所有的符号都纳入其中,每一个符号都给予一个无二的编码。

  Unicode存在的问题:

  Unicode 只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。 如果 Unicode 统一规定,每个符号用三个或四个字节表示,那么每个英文字母前都必然有二到三个字节是0,这对于存储来说是极大的浪费。

  为了解决这个问题:就有了Unicode 三种实现:UTF8 UTF16 UTF32

  UTF8可以方便的转换为UTF16和UTF32

  UTF-8:,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。

  UTF-16:UTF-16 使用二或四个字节为每个字符编码(定长 一般情况下为2字节),因为对于绝大部分字符只使用2个字节就可以表示了。对于汉字而言,大部分汉字采用两个字节编码,少量不常用汉字采用四个字节编码。

  UTF-32:UTF-32 使用四个字节为每个字符编码,使得 UTF-32 占用空间通常会是其它编码的二到四倍。UTF-32 与 UTF-16 一样有大尾序和小尾序之别,编码前会放置 U+0000FEFF 或 U+0000FFFE 以区分。

领取试听课
每天限量名额,先到先得

尊重原创文章,转载请注明出处与链接:http://www.peixun360.com/8877/news/688306/违者必究! 以上就是佛山童程童美信息学编程学习机构 小编为您整理 信息学奥赛编程知识 Unicode编码的全部内容。

温馨提示:提交留言后老师会第一时间与您联系!热线电话:400-6263-721