解决使用Pandas 读取超过65536行的Excel文件问题

qqarmor37980 32 0 pdf 2021-07-06 12:07:30

今天需要合并天猫订单数据,由于前期6.18活动有很多数据需要处理,将几个月份合并一起,结果报错。从 Excel 2007 版开始,默认采用了基于 XML 的新的文件格式 .xlsx ,支持的表格行数达到了 1,048,576,列数达到了 16,384。需要注意的是,将 .xlsx 格式的文件转换为 .xls 格式的文件时,65536 行和 256 列之后的数据都会被丢弃。Pandas 读取 Excel 文件的引擎是 xlrd , xlrd 虽然同时支持 .xlsx 和 .xls 两种文件格式,但是在源码文件 xlrd/sheet.py 中限制了读取的 Excel 文件行数必须小于 65536,列数必须小于 256。openpyxl 是一个专门用来操作 .xlsx 格式文件的 Python 库,和 xlrd 相比它对于最大行列数的支持和 .xlsx 文件所定义的最大行列数一致。

解决使用Pandas 读取超过65536行的Excel文件问题

解决使用Pandas 读取超过65536行的Excel文件问题

解决使用Pandas 读取超过65536行的Excel文件问题

解决使用Pandas 读取超过65536行的Excel文件问题

用户评论
请输入评论内容
评分:
暂无评论