位置:郑州童程童美信息学编程机构 > 学校动态 > 信息学奥赛信息编码知识点 汉字信息编码
信息编码基本概念
1.编码
计算机要处理的数据除了数值数据以外,还有各类符号、图形、图像和声音等非数值数据。而计算机只能识别两个数字。要使计算机能处理这些信息,首先必须将各类信息转换成0和1表示的代码,这一过程称为编码。
2.数据
能被计算机接受和处理的符号的集合都称为数据。
3.比特
比特(Bit,二进制数位)是指1位二进制的数码(即0或1).比特是计算机中表示信息的数据编码的较小单位。
4.字节
字节表示被处理的一组连续的二进制数字。通常用8位二进制数字表示一个字节,即一个字节有8个比特组成。 1Byte= 8bit
字节是存储系统的较小存取单位。
汉字信息编码
1. 汉字交换码
汉字交换码是指不同的汉字处理功能的计算机系统之间在交换汉字信息时所使用的的代码标准。自标准GB-2312公布以来,我国一直延用该标准所规定的国标码作为统一的汉字信息交换码GB5007-85图形字符编码。
GB2312-80标准包括了6763个汉字,按其使用频率分为一级汉字3755个和二级汉字3008个。一级汉字按拼音排序,二级汉字按部首排序。该标准还包括标点符号、数种西文字母、图形、数码等符号682个。
区位码的区码和位码采用从01到94的十进制,国标码采用十六进制的21H到73H。区位码和国标码的换算关系是:区码和位码分别加上十进制32。如“国” 字在表中的25行90列,其区位码为2590。国标码是397AH。
2.字形存储码
字形存储码是指供计算机输出汉字(显示或打印)用的二进制信息,也称子模。通常,采用的数字化点阵字模。
一般的点阵规模有16*16、24*24等。每一个点在存储器中用一个二进制位(bit)存储。在16*16的点阵中,需8*32bit的存储空间,每8bit为1字节,所以,需32字节的存储空间。在相同点阵中,不管其笔画繁琐,每个汉字所长空间所占字节数相等。
例如:在24*24点阵的字库中,汉字“一“ 与 “魏”的字模占用的字节数分别是( 72,72)
解析:24*24点阵的字模需要24*24个二进制来存储。每个字节有8个二进制位。所以汉字字模占用字节数24*24/8=72个字节。汉字 “一”和“魏”简繁不一样,但所需空间是一样的。
尊重原创文章,转载请注明出处与链接:http://www.peixun360.com/9019/news/688328/违者必究! 以上就是郑州童程童美信息学编程机构 小编为您整理 信息学奥赛信息编码知识点 汉字信息编码的全部内容。