一、Unicode是什么? Unicode源于一个很简单的想法:将全世界所有的字符包含在一个集合里,计算机只要支持这一个字符集,就能显示所有的字符,再也不会有乱码了。 它从0开始,为每个符号指定一个编号,这叫做”码点”(codepoint)。比如,码点0的符号就是null(表示所有二进制位都是0)。 代码如下:U+0000 = null 上式中,U+表示紧跟在后面的十六进制数是Unicode的码点。 目前,Unicode的最新版本是7.0版,一共收入了109449个符号,其中的中日韩文字为74500个。可以近似认为,全世界现有的符号当中,三分之二以上来自东亚文字。比如,中文”好”