自述文件 新浪微博自动文摘系统 给定微博话题数据集,从中筛选出前N(N> 0)条微博,作为话题摘要。 问题实质:短文本多文档自动文摘。 流程:数据-算法-评估-展现 数据获取与预先:如何通过编写爬虫获取网站数据? 摘要算法:如何使用Python及其相关工具集实现算法?(阅读论文和资料理解算法,理解公式意味着,将公式转换为实际代码,也有很多算法在Python中已经实现,可以直接使用) 摘要评估:如何对不同算法的结果进行评估?(ROUGE评估方式,中文评估注意点) 系统展现:如何实现前端展现和后台管理的系统?(Flask,Flask-Admin; Bootstrap,E-Charts)如何部署系统