而由于编码、传输、解码过程存在各种不确定性,导致乱码问题频发,成为困扰初学者的一大问题。它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646。GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。基本集共收入汉字6763个和非汉字图形字符682个。GB 2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国大陆99.75%的使用频率。1995年中国国家标准总局又颁布了《汉字编码扩展规范》。Unicode字符的码位,需要1个或者2个16位长的码元来表示,因此这是一个定长表示。发送端及接收端编码一致,所以不会产生乱码问题。原因是因为getBytes实际是指定按照UTF-8编码将字符串转换成字节数组。
暂无评论