人工智能领域深度学习的一个自然语言数据集,可以用来训练自然语言模型