
吕老师为您分享以下优质知识
汉字编码在不同应用场景中有不同的名称和作用,主要分为以下几类:
一、按应用功能分类
用于将汉字输入计算机的编码,如拼音码、五笔字型码、区位码等。其核心目标是简化输入过程,需具备规则简单、重码率低、输入速度快等特点。
交换码(国标码)
用于计算机内部信息交换的标准编码,如GB2312、GBK等。国标码将汉字映射为固定长度的二进制代码,便于不同系统间的数据传输。
机内码
计算机内部实际存储和处理的编码,通常在国标码基础上加8083H(即每个代码加0x8083)形成。例如,国标码“福”(65291)对应的机内码为“E6A891”。
字形码
用于汉字输出的编码,通常以16×16点阵形式表示汉字字形,如宋体、黑体等字体的具体像素排列。
二、常见汉字编码标准
GB2312
中国国家标准,包含约7000个简体汉字和870个繁体汉字,是最早的汉字编码系统。
GBK
GB2312的扩展版,增加了约1600个繁体汉字及符号,兼容简繁体中文显示。
GB18030
支持简/繁体中文及少数民族文字,覆盖汉字总数达87000个,是更全面的汉字编码标准。
Unicode
全球通用字符编码,包含超过130万种字符,支持多语言文字,是计算机领域最广泛使用的编码标准。
三、其他补充说明
区位码:
国标码的另一种表现形式,将8836个编码位置划分为94个区,每个汉字占用一个位置(实际保留1391个空位备用)。
扩展编码:如Big5(大五码)主要用于台湾地区,与GB2312结构相似但编码范围不同。
综上,汉字编码根据功能可分为外码、交换码、机内码和字形码,其中GB2312、GBK、GB18030等是针对中文字符的专用编码标准,而Unicode则是国际通用的解决方案。