基于图的同义词集自动获取方法

PanYHHH 9 0 PDF 2021-04-18 04:04:56

同义词集是重要的语言基础知识,基于大规模语料库的同义词集自动获取是自然语言处理领域的一项基础性研究课题.从大规模语料中自动获取有并列结构关联的词语对,据此形成图,采用Newman算法对图进行划分而自动聚类相似词语.着重研究在Newman算法的基础上,充分挖掘和利用并列结构的特性和汉语的构词特点,采用6种方法对图中边的权值加以改进从而提升效果:分割语料、去除低频边、加重双向边、加重团、加重相同后字、惩罚音节不等.同义词集自动获取的准确率从初始的23.28%提升至53.12%,准确率提高了约30个百分点.

资源预览

用户评论

暂无评论

哈工大同义词词林扩展版.zip

学习NLP的同学在进行同义词替换、关键词扩展等操作时常用到同义词词林,哈工大社会计算与信息检索研究中心同义词词林扩展版,较为适用,有需要的可下载使用

139 2020-11-24
同义词词库用于关键词替换伪原创

NULL博文链接：https://jacky2007.iteye.com/blog/801218

46 2020-04-20
伪原创同义词库可用于火车头采集器同义词替换

伪原创同义词库可用于火车头采集器 dicsuz替换

151 2019-02-17
seo工具同义词替换易语言源码

seo工具同义词替换[易语言源码] http://www.jf40.com/谜尚Missha http://www.meqiqi.com/蒙奇奇

47 2019-02-16
seo必备文章伪原创同义词替换

seo必备文章伪原创。同义词替换,内合计有25631个同义词替换，可以一键替换。一键伪原创。

63 2019-05-17
同义词大全可导入火车头

不假思索,搜索枯肠不仅,不只不近人情,通情达理不禁,不由不胫而走,不翼而飞不拘一格,形形色色不堪设想,不可思议不堪一击,摧枯拉朽不可动摇,见异思迁不可多得,车载斗量不可救药,病入膏肓不可开交,不亦乐乎

24 2019-05-14
USETHERIGHTWORD_MODERNGUIDETOSYNONYMSANDRELATEDWORDS英文同义词辨析词典

英文同义词辨析词典。USETHERIGHTWORDMODERNGUIDETOSYNONYMSANDRELATEDWORDSlistsofantonymscopiouscross-referencesa

30 2019-05-14
1.7万条中文同义词词库

同义词词典中文同义词词库，txt文档。同义词的词库，希望对大家有帮助

33 2019-05-27
易语言伪原创同义词替换源码

易语言伪原创同义词替换源码

24 2019-06-04
44000条伪原创同义词近义词库

用于伪原创的同义词，近义词库，4万多条都在一个txt文档里，每行都是一组同义词。

75 2019-05-31

基于图的同义词集自动获取方法

资源预览

用户评论

推荐下载