首页  > 教育解读  > 汉字使用什么进行存储

汉字使用什么进行存储

2025-05-01 23:19:53
公共使者
公共使者已认证

公共使者为您分享以下优质知识

汉字在计算机中的存储涉及多个层面的编码方式,具体如下:

一、存储编码方式

机内码(内部存储/处理编码)

汉字在计算机内部存储、处理和传输时使用 机内码。机内码是汉字的计算机内部表示形式,通常为 GB2312-80(国标码加128)或 UTF-8(更通用,支持更多字符)。 - GB2312-80:

适用于汉字处理系统间的信息交换,如中国大陆、新加坡等地。

- UTF-8:现代系统主流编码,可表示包括生僻字、表情符号等在内的全字符集。

字形码(显示/输出编码)

汉字最终以 字形码形式存储,用于屏幕显示或打印输出。字形码通常采用点阵形式(如16×16、24×24、32×32点阵),每个点用二进制值表示汉字的轮廓。

二、编码转换过程

输入阶段:

用户通过输入法输入汉字,输入设备将字符转换为 外码(如拼音或全码)。

转换阶段:系统将外码转换为 机内码,完成存储和处理的准备。

输出阶段:显示设备根据机内码调用对应的字形码进行渲染。

三、其他相关说明

兼容性:为避免ASCII码与国标码冲突,机内码通常在国标码基础上加128(如“中”字的国标码0x4E2D加128为0x902D)。

扩展性:UTF-8采用变长编码,简单字符(如英文)占用1个字节,复杂字符(如汉字)占用2-4个字节,效率更高。

综上,汉字存储采用 机内码(如GB2312-80或UTF-8)进行内部处理,而 字形码则用于实际的显示和输出。