机器学习算法中自然语言处理常用数据集(新闻数据集news.csv)及jieba_dict字典、停用词等相关文件
机器学习算法中自然语言处理常用数据集(新闻数据集news.csv)及jieba_dict字典、停用词等相关文件,包括以下文件 data/news.csv jieba_dict/dict.txt.big jieba_dict/stopwords.txt jieba_dict/stopwords_s.txt
用户评论
推荐下载
-
深度学习数据集新闻文本分类数据集50000条
50000条新闻文本数据集,文本有9类。可用于文本分类模型训练。
90 2019-04-27 -
自然语言处理
自然语言处理的经典教材,包括汉语的计算机理解,语义分析,概念分析,故事表示,WordNet,词语聚集理论,词汇功能文法,词汇的树邻接文法,链接文法,语料库语言学,词汇语义驱动,中间语言表示法,扩展语段
48 2019-03-05 -
自然语言处理ppt自然语言处理模型描述
自然语言处理模型描述,上课用的自然语言处理课件,不可多得的资源
55 2019-07-27 -
机器学习python处理UCI鲍鱼数据集.rar
利用python处理UCI鲍鱼年龄预测数据,运用了经典回归、决策树、随机森林、SVM等十余种机器学习方法,附有数据集以及详细python代码
61 2020-03-05 -
斯坦福自然语言推理SNLI语料库数据集
SNLI语料库(1.0版)是一个570k人工编写的英语句子对的集合,这些句子对经过手动标记以实现平衡分类,并带有enume,矛盾和中性标签,支持自然语言推理(NLI)的任务,也称为识别文本蕴涵(RTE
16 2021-04-30 -
Winograd NLI.zip基于BERT的自然语言推理数据集
Winograd NLI.zip是一种基于BERT模型的自然语言推理数据集,专门用于评估语言模型的推理能力。该数据集包括一系列句子对,其中每对句子都具有关联关系,需要根据上下文进行推理判断。使用BER
53 2023-10-17 -
常用停用词库推荐及应用
本文介绍四种常用的中文停用词库,包括cn_stopwords.txt、hit_stopwords.txt、baidu_stopwords.txt和scu_stopwords.txt,并探讨了它们在词云
12 2023-03-17 -
机器学习1数据预处理数据集与源码下载
机器学习(1)-数据预处理:数据集与源码下载。博客当中用到的源码与数据集
22 2020-06-16 -
自然语言处理相关ppt.zip
微软亚洲研究院自然语言计算组武威研究员的ppt,以及2019年相关nlp、知识图谱的报告
40 2019-09-18 -
深度学习与自然语言处理
2018年发布的,由佐治亚理工学院交互计算学院副教授JacobEisenstein编写的深度学习与自然语言处理的教材。LEARNING;SEQUENCESandTREES;MEANING
32 2019-05-15
暂无评论