中文的编码表示
我国是个多民族的国家, 共有近60种民族文字, 其中用得最多最广的是汉字, 其它还有蒙、藏、朝鲜、僮、苗、哈尼、维吾尔等多种文字。计算机中文处理系统, 应尽可能地处理各种中文文字, 但其中最关键的技术, 是很好地解决汉字的编码方案、存储技术和输入输出方法。
在计算机中,通常用两个字节表示一个汉字。为了与西文字符的编码相区别,把表示一个汉字的两个字节的最高一个二进制位设定为1,而常用的西文字符ASCII码编码的最高一个二进制位总是为0。这种汉字编码方案的编码集最多编码数量为128*128个,而且它与西文传送中的把ASCII码的最高一个二进制位作为一个字符七位编码的奇偶校验位的用法有矛盾。