一个简单的新闻语料库,包含5个类别,每个类别500篇文档。