Ta上传的资源 (0)

数据集包含三个文件,一个是垃圾邮件的数据集,也包含一些基本的处理代码。一个是中文分词的数据集,还有一个是用于命名实体识别的数据集(分为训练集和测试集),来源于人命日报。

使用seq2seq模型与attention注意力机制生成对联,数据集中有预处理代码,其对应的工程代码github地址:https://github.com/zhangzhiqiangccm/NLP-project