本书概览 本书的结构大致如下。 •第1章介绍机器学习的基本概念及其应用,并给出本书会用到的基本设置。 •第2章和第3章介绍实践中最常用的机器学习算法,并讨论这些算法的优缺点。 •第4章介绍在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些 方面。 •第5章介绍模型评估和调参的高级方法,重点讲解交叉验证和网格搜索。 •第6章解释管道的概念。管道用于串联多个模型并封装工作流。 •第7章介绍如何将前面各章讲述的方法应用到文本数据上,还介绍了一些文本特有的处 理方法。 •第8章对全书进行总结,还介绍了有关更高级主题的参考资料。 第1章