Ta上传的资源 (0)

词法分析是自然语言处理的基础与关键。张华平博士在多年研究工作积累的 基础上,研制出了NLPIR分词系统,主要功能包括中文分词;英文分词;词性标 注;命名实体识别;新词识别;关键词提取;支持用户专业词典与微博分析。NLPIR 系统支持多种编码(GBK编码、UTF8编码、BIG5编码)、多种操作系统(W

在XML应用中,最常用也最实用的莫过于XML文件的读写,所以笔者通过一个简单的XML文件读写来作简要分析。可以在任何文本编辑器中先建立如下结构的XML文件,类似于HTML结构,但XML语义比较严格,起始标记必须配对,

THUOCL(THUOpenChineseLexicon)是由清华大学自然语言处理与社会人文计算实验室整理推出的一套高质量的中文词库,词表来自主流网站的社会标签、搜索热词、输入法词库等。THUOCL具有以下特点:包含词频统计信息DF值(DocumentFrequency),方便用户个性化选择使用。词

该软件可以实现微博分析、聊天分析、全网分析、网站分析、浏览分析、分词、词频统计、英文词频统计、流量分析、聚类分析等一系列文本分析(Thesoftwarecanrealizemicro-bloganalysis,chatanalysis,wholenetworkanalysis,websiteanal

该情感词汇本体由大连理工大学信息检索研究室独立整理标注完成,可供国内外大学、科研院所及个人用于学术研究目的。