Python爬虫教程:Beautiful Soup库是一个能够从HTML或XML中快速提取数据的Python工具。它支持各种转换器,可以方便地解析和查找HTML文档。Beautiful Soup会自动处理编码转换,将输入文档转为Unicode编码,输出文档转为UTF-8编码,因此编码方面无需烦恼。当然,如果文档没有指定编码方式,只需指明原始编码即可。