cpp THULAC一个高效的中文词法分析工具包
THULAC是一款相当不错的中文分词工具,准确率高、分词速度蛮快的;并且在工程上做了很多优化,比如:用DAT存储训练特征(压缩训练模型),加入了标点符号的特征(提高分词准确率)等
文件列表
cpp-THULAC一个高效的中文词法分析工具包.zip
(预估有个31文件)
THULAC-master
test
thulac_test.h
2KB
test_case.cpp
2KB
include
cb_model.h
4KB
thulac_base.h
3KB
dat.h
10KB
verbword.h
778B
thulac_lib.cc
8KB
暂无评论