词性标注包(acopost-1.8.6)源代码阅读笔记
acopost是Ingo Schroder于02年在德国汉堡大学完成的一个词性标注工具包。主要实现了基于实例、最大熵、2元隐马、基于转换规则等4种词性标注算法,以及评价和算法融合等。采用的语言是perl和c,代码比较短小,非常适于学习。 本笔记记录内容: o 对acopost所实现的每个算法的训练和标注的基本流程、函数调用关系、相关文献等做了记录和阐述; o 对每个算法相关的源文件进行了详细注释; o 以汉语分词为实例,记录了4个标注算法的训练和标注结果。 [acopost] http://acopost.sourceforge.net/
文件列表
acopost_note.zip
(预估有个63文件)
acopost_note
README.txt
88B
et.txt
8KB
comment
gis.h
3KB
et.c
27KB
cooked2ngram.pl
1KB
array.c
675B
t3.c
51KB
util.c
5KB
用户评论