
公考顾老师为您分享以下优质知识
汉字的国际码是指用于汉字信息处理的标准编码方案,主要分为以下两类:
- 由国家标准总局发布,是汉字国际码的基础标准,包含基本集(6763个简化字)和五个辅助集,共收录7445个图形字符。
- 每个汉字用2个字节表示,范围为0x0000-0x9FFF,最高位为0。
Unicode编码(国际通用码)
- 基于Unicode标准,为每个汉字分配唯一编码,支持全球多语言字符集,包括汉字、日文、西里尔字母等。
- 编码长度因字符而异,常见有2-4个字节(如UTF-8编码)。
补充说明:
GB2312是汉字国际码的代表,广泛应用于计算机系统间的汉字交换;
Unicode是更通用的国际编码标准,但需注意其与GB2312的编码规则不同。