菜鸟笔记
提升您的技术认知

gb2312和gbk的区别?-ag真人游戏

展开全部

1、收录不同:gb2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;gbk共收入21886个汉字和图形符号。

2、表示不同:gb2312对任意一个图形字符都采用两个字节表示,并对所收汉字进行了“分区”处理,每区含有94个汉字/符号,分别对应第一字节和第二字节。gbk采用双字节表示,总体编码范围为8140-fefe之间,首字节在81-fe之间,尾字节在40-fe之间。

3、处理功能不同:对于人名、古汉语等方面出现的罕用字,gb2312不能处理,这导致了后来gbk 及gb18030 汉字字符集的出现。

扩展资料

汉字编码的困难原因:

1、数量庞大:一般认为,汉字总数已超过6万个(包括简化字)。虽有研究者主张规定3000多或4000字作为当代通用汉字,但仍比处理由二三十个字母组成的拼音文字要困难得多。

2、字形复杂:有古体今体,繁体简体,正体异体;而且笔画相差悬殊,少的一笔,多的达36笔,简化后平均为9.8笔。

网站地图