英语文本分类数据集很常见。 例如大型 AG 新闻、类丰富的 20 个新闻组和用于主题分类的大型 DBpedia 本体论数据集,例如用于情绪分析的常用 IMDb 和 Yelp 数据集。 非英语数据集,尤其是德语数据集,不太常见。 德国情绪分析兴趣小组汇集了一组情绪分析数据集。 然而,据我所知,没有德国主题分类数据集是可用的公众。 Ten Thousand German News Articles Dataset_datasets.zip