cnews.zip 新浪新闻RSS订阅频道10类文本数据

小经事 15 0 ZIP 2020-05-17 21:05:24

数据集是清华大学根据新浪新闻RSS订阅频道2005-2011年间的历史数据筛选过滤生成。数据集一共包括10类新闻,每类新闻65000条文本数据,训练集50000条,测试集10000条,验证集5000条。

用户评论
请输入评论内容
评分:
暂无评论