NLPIRICTCLAS分词系统开发手册2016版 词法分析是自然语言处理的基础与关键。张华平博士在多年研究工作积累的 基础上,研制出了NLPIR分词系统,主要功能包括中文分词;英文分词;词性标 注;命名实体识别;新词识别;关键词提取;支持用户专业词典与微博分析。NLPIR 系统支持多种编码(GBK编码、UTF8编码、BIG5编码)、多种操作系统(W
Java操作XML编程实例解析.doc 在XML应用中,最常用也最实用的莫过于XML文件的读写,所以笔者通过一个简单的XML文件读写来作简要分析。可以在任何文本编辑器中先建立如下结构的XML文件,类似于HTML结构,但XML语义比较严格,起始标记必须配对,
基于svm结合依存句法的金融领域舆情分析 Public opinion analysis of financial field based on svm combined with dependency syntax
清华大学开放中文词库 THUOCL(THUOpenChineseLexicon)是由清华大学自然语言处理与社会人文计算实验室整理推出的一套高质量的中文词库,词表来自主流网站的社会标签、搜索热词、输入法词库等。THUOCL具有以下特点:包含词频统计信息DF值(DocumentFrequency),方便用户个性化选择使用。词
Hownet知网情感词典 该软件可以实现微博分析、聊天分析、全网分析、网站分析、浏览分析、分词、词频统计、英文词频统计、流量分析、聚类分析等一系列文本分析(Thesoftwarecanrealizemicro-bloganalysis,chatanalysis,wholenetworkanalysis,websiteanal