文本上的算法_NLP_路彦雄
《文本上的算法》主要分两大部分:第一部分是理论篇,主要介绍机器学习的基础和一些具体算法;第二部分应用篇,主要是一些NLP的应用,比如:搜索引擎原理是什么?它为什么要建索引?有什么理论基础吗?之所以抽时间写这个文档,是由于以下方面的考虑:1、这些都是我个人的一些总结和思考(有些内容在论文和书籍中都不会看到),零零散散的,所以想整理成一个稍微正式一点的文档,方便查阅;2、这些知识在平常的工作中都会经常用到,整理成这个较正式文档也可以当作读者的一种参考。3、除了必不可少的公式外,尽量以更口语化的方式表达出来,抛弃掉繁琐的证明,提取出算法的核心,尽可能达到深入浅出。由于本人水平有限,难免会有一些错误,希望大家不吝指出。