
心随风动为您分享以下优质知识
国标码(GB2312-80)使用 16位二进制数表示汉字,具体规则如下:
一、编码结构
国标码由 两个字节组成,每个字节8位,共16位二进制数。
高位字节的计算
将区位码的高位4位转换为十六进制后,加上偏移量`20H`(十进制32),再转换为二进制。
低位字节的计算
将区位码的低位4位转换为十六进制后,加上偏移量`20H`(十进制32),再转换为二进制。
二、示例说明
以汉字“中”为例:
区位码:
4921(十进制)
高位字节:49(十六进制)→ `49 + 20H = 69H` → 二进制 `0100 0101`
低位字节:21(十六进制)→ `21 + 20H = 41H` → 二进制 `0010 0101`
国标码:`69H 41H` → 十六进制表示为 `7468`
三、注意事项
与ASCII码的兼容性
由于区位码的区号范围(1-94)与ASCII码冲突(0-127),国标码在计算时需对区号加32(十六进制20),低位码加20(十六进制20)。
编码范围
GB2312-80标准收录了7445个汉字,采用94×94的区位矩阵,覆盖常用汉字及符号。
扩展标准
该标准未收录所有汉字(如生僻字),后续的扩展标准(如GBK、UTF-8)进一步扩大了编码范围。
通过上述规则,国标码实现了汉字在计算机系统中的标准化存储与交换。