20Newsgroups数据集包括20news_1999720news_bydate和20news_18828三个数据集 20Newsgroups数据集是大约20,000个新闻组文档的集合,在20个不同的新闻组中几乎均匀划分。20Newsgroups数据集已经成为机器学习技术相关实验的常用数据集,例如文本分类和文本聚类实验。