engtagger:英语词性标注器库; 林瓜的Ruby端口::Tagger 源码
EngTagger 英文词性标注器库; Lingua的Ruby端口:: EN :: Tagger 描述 Perl Lingua :: EN :: Tagger的Ruby端口,这是一种基于概率的语料库训练的标记器,它基于查找字典和一组概率值将POS标签分配给英语文本。 标记器根据条件概率分配适当的标记-它检查前面的标记以确定当前单词的适当标记。 未知单词根据单词形态进行分类,或者可以设置为名词或其他词性。 标记器还使用一组正则表达式提取尽可能多的名词和名词短语。 产品特点 将POS标签分配给英文文本 从标记的文本中提取名词短语 等等 概要: require 'rubygems' requir
文件列表
engtagger-master.zip
(预估有个15文件)
engtagger-master
.gitignore
154B
engtagger.gemspec
872B
LICENSE
19KB
README.md
6KB
lib
engtagger.rb
26KB
engtagger
tags.yml
23KB
words.yml
954KB
暂无评论