基于感知机的分词算法简介 我原来发过一个“python写的基于感知机的中文分词系统”的资源,那个是很完整的代码,包括训练数据等。但是代码没有任何注释,所以我又提交这个说明文档。但这个文档是用pageplayer做的(pageplayer压缩后有19M我发不上来),写的简略,但是还比较清楚,包括算法时间分析,改进等等。希望对大
python版本AdaBoost的标准算法 经典的AdaBoost算法。实现了二维上两类分类问题,标准算法。包含数据,例子。最近下载了别人很多文档,自己快没分了,就想挣点分。 www.cs.princeton.edu/courses/archive/spr04/cos511/boost-slides.pdf
python写的基于感知机的中文分词系统 基于字的用感知机实现的中文分词系统。完全训练后对微软的测试集精度可以达到96%多。我上传的版本是完整的代码(训练和分词),大家自己用附带的微软训练数据训练就可以了,只有一个文件。 代码总的来说写的还是很清楚的,方便自己也方便别人阅读。欢迎大家共讨论,xiatian@ict.ac.cn。