基于Python的Word表格数据提取与Excel存储

介绍如何使用Python从Word文档中提取表格数据并保存到Excel文件。

必要库

  • docx: 用于读取和操作Microsoft Word (.docx) 文件。
  • openpyxl: 用于处理Excel (.xlsx) 文件。

代码示例

from docx import Document
from openpyxl import Workbook

# 加载Word文档
document = Document('your_word_file.docx')
tables = document.tables

# 创建新的Excel工作簿
wb = Workbook()
ws = wb.active

# 遍历Word表格并写入Excel
for table in tables:
    for row in table.rows:
        data = [cell.text for cell in row.cells]
        ws.append(data)

# 保存Excel文件
wb.save('extracted_tables.xlsx') 

代码说明

  1. 首先,使用docx库加载Word文档并获取所有表格。
  2. 然后,使用openpyxl库创建一个新的Excel工作簿和工作表。
  3. 遍历Word文档中的每个表格和行,将单元格数据提取到一个列表中。
  4. 将提取的数据追加到Excel工作表的行中。
  5. 最后,将数据保存到新的Excel文件中。

总结

通过以上步骤,可以轻松地使用Python实现Word表格数据到Excel的自动化提取和存储。