
公共使者为您分享以下优质知识
汉字在计算机中的存储涉及多个层面的编码方式,具体如下:
一、存储编码方式
汉字在计算机内部存储、处理和传输时使用 机内码。机内码是汉字的计算机内部表示形式,通常为 GB2312-80(国标码加128)或 UTF-8(更通用,支持更多字符)。 - GB2312-80:
适用于汉字处理系统间的信息交换,如中国大陆、新加坡等地。
- UTF-8:现代系统主流编码,可表示包括生僻字、表情符号等在内的全字符集。
汉字最终以 字形码形式存储,用于屏幕显示或打印输出。字形码通常采用点阵形式(如16×16、24×24、32×32点阵),每个点用二进制值表示汉字的轮廓。
二、编码转换过程
输入阶段:
用户通过输入法输入汉字,输入设备将字符转换为 外码(如拼音或全码)。
转换阶段:系统将外码转换为 机内码,完成存储和处理的准备。
输出阶段:显示设备根据机内码调用对应的字形码进行渲染。
三、其他相关说明
兼容性:为避免ASCII码与国标码冲突,机内码通常在国标码基础上加128(如“中”字的国标码0x4E2D加128为0x902D)。
扩展性:UTF-8采用变长编码,简单字符(如英文)占用1个字节,复杂字符(如汉字)占用2-4个字节,效率更高。
综上,汉字存储采用 机内码(如GB2312-80或UTF-8)进行内部处理,而 字形码则用于实际的显示和输出。