自然语言处理全集
自然语言处理(汉语)算法实现,Java语言实现,经过优化,效率很高。主要包括: 1)汉语分词,采用ICTCLAS系统和Lucene+庖丁解牛系统 2)情感倾向性分析,包括基于统计学习的SVM算法,基于情感词典的词语权重算法,给出文档的情感权重和情感倾向 3)文本聚类,包括KMeas算法实现,文档向量建模,以及采用Weka API 库效率比较 4)词语关系网络,包括词语距离计算,构建词语的近似程度,并刻画词语网络图 5)抽象摘要,采用TFIDF计算文档关键词进行摘要和关键字提取 经过部分优化,对于大数据量处理瓶颈的优化
文件列表
自然语言处理全集
(预估有个298文件)
21e8f115190210a521b436a7510dc346524982
779KB
012772b13673011a9f0def1984e1155e851f38
900B
23516c92b17c4cf3b550bd9318890ad0362521
205B
281b894149dba9d72c2a0a1b5e05324c06be3a
54B
15d1f1b8c5316891a9993623e8dd7ef36d94b9
164B
0290c265f12d3c5a05085ad74cf7aafa286499
94B
187363365fd10021e1a1e6f050b03a899a076c
55B
0b205c716537dbc9ad91dc46357d944015a612
363B
058bca174d685625c84b68a9741aaeb04c6ba6
407B
21537071bf4118b9e1ee864cb4bc258aa48211
210B
用户评论