第三章旨在深度探索机器学习算法的基石,重点聚焦于NLP的算法体系。当前,主流机器学习算法主要分为两大类:(1)传统基于统计学的机器学习算法体系;(2)人工神经网络算法体系。在NLP相关任务中,常见算法如朴素贝叶斯、支持向量机、逻辑回归等广泛应用于文本分类,同时k-means方法被用于文本聚类等任务。近年来,对大脑和语言内在机制的深入了解使我们能够从更高的层次观察和认知思维现象,形成了一套人工神经网络算法体系。本章将详细探讨机器学习算法和人工神经网络算法的概念、原理和方法。