当时世界上所有的计算机都用同样的ASCII方案来保存英文文字。从128到255这一页的字符集被称”扩展字符集”。等中国人们得到计算机时,已经没有可以利用的字节状态来表示汉字,况且有6000多个常用汉字需要保存呢。他们打算叫它”Universal Multiple-Octet Coded Character Set”,简称 UCS, 俗称 “UNICODE”。UNICODE 开始制订时,计算机的存储器容量极大地发展了,空间再也不成为问题了。是的,从 UNICODE 开始,无论是半角的英文字母,还是全角的汉字,它们都是统一的”一个字符”!一个汉字算两个英文字符的时代已经快过去了。但是,UNICODE 在制订时没有考虑与任何一种现有的编码方案保持兼容,这使得 GBK 与UNICODE 在汉字的内码编排上完全是不一样的,没有一种

字符编码详解(基础)

字符编码详解(基础)

字符编码详解(基础)