
耐性与骨气为您分享以下优质知识
在计算机中,汉字的传输涉及不同层面的编码方式,具体如下:
一、传输编码类型
汉字在计算机内部传输、存储和处理时使用 机内码(又称汉字ASCII码),这是计算机能够识别和处理的编码形式。机内码是国标码(如GB2312)每个字节加128(0x80)后得到的值,用于避免与ASCII码冲突。
字形码
显示或打印汉字时使用 字形码,即汉字的点阵图数据,用于在屏幕或打印机上呈现具体字形。
区位码与国标码
- 区位码:
GB2312编码中,每个汉字由一个区号(1-94)和一个位号(1-94)组成,通过区位表转换为十六进制后再加上2020H得到国标码。
- 国标码:国标码是区位码加2020H,但计算机内部仍需转换为机内码(加8080H)后使用。
二、传输过程示例
用户通过输入法输入汉字(如“中”),输入法将汉字转换为 外码(如GB2312编码)。
编码转换
输入法将外码转换为 机内码,计算机才能识别并存储。例如,“中”的机内码为 E4B8(GB2312编码)。
网络传输
机内码以二进制形式通过网络传输,接收方收到后根据协议解析为机内码,再转换为对应字形码显示。
三、注意事项
乱码问题:
若接收方无对应汉字库,接收到的机内码无法直接显示,需先转换为字形码。
扩展规范:GB2312扩展为GBK,支持更多汉字,其编码规则与机内码兼容。
综上,汉字在计算机内部传输的核心编码是 机内码,而字形码仅用于最终显示,区位码和国标码则用于编码转换过程。