写在前面,仅供学习交流。 编程环境: win10, office2019 docx文本提取超链接并写入TXT文档: from pydocx import PyDocX from bs4 import BeautifulSoup # 用于解析网页 #by:菜鸟阿样 # 转docx为html文本 html = PyDocX.to_html("docx文本名") # 加载文本 bsObj = BeautifulSoup(html, 'html.parser') # 提取所有方法 t1 = bsObj.find_all('a') txt = '' #统计结果写入txt文档 with open('计.