李荣陆全部数据集,训练语料共9804篇文档,分为20个类别,测试语料共9833篇文档,同为20个类别。来源复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)