基于海量新闻语料训练得到的实体词向量
该资源便于对词向量感兴趣的童鞋进行实验
用户评论
推荐下载
-
中文文本分类语料训练测试全集复旦
本资源是复旦大学中文文本分类预料压缩包,包含训练与测试全集。
14 2020-04-20 -
支持向量机在线训练算法及其应用
针对支持向量机在线训练算法训练速度较慢和无法处理边缘支持向量集合为空的缺点,以KKT 条件和拉 格朗日乘数法为基础,用严格的数学推导得到一种改进的训练算法. 通过建立一个矩阵缓存来保存与核函数相关的
30 2019-03-08 -
中文文本分类_新闻语料库.zip
做毕设自用的中文新闻文本分类语料库,整理自搜狗新闻和清华新闻语料,共八个类别,每类已分好4000条训练集和1000条测试集。附赠一份停用词表,综合了哈工大停用词及川大停用词。
19 2020-05-26 -
汉语单词向量100多个汉语单词向量上百种预训练中文词向量源码
中文单词向量 该项目提供了100多个中文单词向量(嵌入),它们经过不同的表示(密集和稀疏),上下文特征(单词,ngram,字符等)和语料库训练。 可以轻松获得具有不同属性的预训练向量,并将其用于下游任
22 2021-02-24 -
基于ssh的新闻
基于ssh的新闻系统
22 2019-10-05 -
论文研究基于有效上下文信息的变体词还原方法.pdf
在社交网络上,用户常创造一些变体词来替代部分实体名词,将这些变体词还原为原目标词是自然语言处理中的一项重要工作。针对现有变体词还原方法准确率不够高的问题,提出了基于有效上下文信息的变体词还原方法。该方
4 2020-07-18 -
微软亚研的中文分词词性标注和命名实体识别语料
微软亚研的中文分词、词性标注和命名实体识别语料,包括训练和验证集,xml格式,方便使用,机器学习、信息检索以及NLP领域的研究人员使用来训练模型
42 2019-10-04 -
GoogleNews训练好的词向量文件每个词向量300维度很好用
训练好的词向量文件,很好用,也很丰富,基本的词汇里面都有,每个词向量300维度,给的百度云下载链接,压缩后1.5个G
60 2020-01-30 -
基于HBase的海量数据查询
本文当是一个基于HBase的海量数据的实实时查询系统的原理分析。详细的介绍了大数据查询的原理。
42 2019-05-06 -
基于云计算的海量数据挖掘
基于云计算的海量数据挖掘方面一篇不错的文章
18 2020-07-16
暂无评论