这些错误一看就是编码问题, 本篇博文总结一下Python3文件读写及字符操作中的编码。ASCII编码就是用1个字节来存储字符,计算机最初是美国人发明的,他们的符号不多,所以还将8个0和1序列中的第一位固定为0,ASCII只能表示127个字符。GB2312编码用2个字节表示一个字符。所以,Unicode也被称为万国码。为了解决这一问题,就有了utf-8编码。3 str与bytes 在Python3中,文本总是为Unicode编码,在类型上为str类,也就是说Python编译器只会把Unicode编码下的二进制流显示为我们可识别的符号。二进制流在Python中也有一个专门的类用于表示这种二进制序列,那就是bytes。但官方只认中文,所以就必须把“eat”用英语(编码)的表示方式转化为中文的“吃饭”,官方才会显示知道是吃饭这件事。
暂无评论