详解字符串在Python内部是如何省内存的
起步 Python3 起,str 就采用了 Unicode 编码(注意这里并不是 utf8 编码,尽管 .py 文件默认编码是 utf8 )。 每个标准 Unicode 字符占用 4 个字节。这对于内存来说,无疑是一种浪费。 Unicode 是表示了一种字符集,而为了传输方便,衍生出里如 utf8 , utf16 等编码方案来节省存储空间。Python内部存储字符串也采用了类似的形式。 三种内部表示Unicode字符串 为了减少内存的消耗,Python使用了三种不同单位长度来表示字符串: 每个字符 1 个字节(Latin-1) 每个字符 2 个字节(UCS-2) 每个字符 4
暂无评论