EngTagger 英文词性标注器库; Lingua的Ruby端口:: EN :: Tagger 描述 Perl Lingua :: EN :: Tagger的Ruby端口,这是一种基于概率的语料库训练的标记器,它基于查找字典和一组概率值将POS标签分配给英语文本。 标记器根据条件概率分配适当的标记-它检查前面的标记以确定当前单词的适当标记。 未知单词根据单词形态进行分类,或者可以设置为名词或其他词性。 标记器还使用一组正则表达式提取尽可能多的名词和名词短语。 产品特点 将POS标签分配给英文文本 从标记的文本中提取名词短语 等等 概要: require 'rubygems' requir