html2text html2text是一个Python脚本,可将HTML页面转换为清晰易读的纯ASCII文本。 更好的是,ASCII也恰好是有效的Markdown(文本到HTML格式)。 用法: html2text [filename [encoding]] 选项 描述 --version 显示程序的版本号并退出 -h , --help 显示此帮助消息并退出 --ignore-links 不要包含任何链接格式 --escape-all 转义所有特殊字符。 输出的可读性较差,但可以避免出现特例格式问题。 --reference-links 使用参考链接而不是链接来创建降价促销