# train_step.txt编程实践
ccpp_train.txt
ccpp_train.txt
train_LM.txt
语言模型 python实现uni-gram和bi-gram 使用ppl困惑度对比模型效果 山东大学2019NLP实验1
train_data.txt
命名实体人物优化后语料,对大量单字人物进行了重新标注
zhengqi_train.txt
zhengqi_train.txt
diabetes_train.txt
糖尿病数据集,主要用于机器学习或者深度学习分类算法,共有9个字段 前8个维变量,最后一个字段为标签,为二分类数据集,当然自己可以
bayes_train_text.txt
1bayes_train_text.txt
目标驱动_train.txt
目标驱动数据集,可以用于对话驱动,该数据集较小,可以验证自己的算法。
my_train_data.txt
my_train_data.txt
umich sentiment train.txt
kaggle 的 umich-sentiment-train.txt情感分析数据集
text8.train.txt
word2vec的训练语料库text8.train.txt。一个很长的字符串,用来训练词向量。文件大小大约62M。