基于Python的Word表格数据提取与Excel存储
介绍如何使用Python从Word文档中提取表格数据并保存到Excel文件。
必要库
docx
: 用于读取和操作Microsoft Word (.docx) 文件。openpyxl
: 用于处理Excel (.xlsx) 文件。
代码示例
from docx import Document
from openpyxl import Workbook
# 加载Word文档
document = Document('your_word_file.docx')
tables = document.tables
# 创建新的Excel工作簿
wb = Workbook()
ws = wb.active
# 遍历Word表格并写入Excel
for table in tables:
for row in table.rows:
data = [cell.text for cell in row.cells]
ws.append(data)
# 保存Excel文件
wb.save('extracted_tables.xlsx')
代码说明
- 首先,使用
docx
库加载Word文档并获取所有表格。 - 然后,使用
openpyxl
库创建一个新的Excel工作簿和工作表。 - 遍历Word文档中的每个表格和行,将单元格数据提取到一个列表中。
- 将提取的数据追加到Excel工作表的行中。
- 最后,将数据保存到新的Excel文件中。
总结
通过以上步骤,可以轻松地使用Python实现Word表格数据到Excel的自动化提取和存储。
暂无评论