垃圾邮件处理.zip #词向量与垃圾邮件识别 ##前置知识-词袋和词向量 机器学习模型所接受的样本是一行一行的,每一行都有很多个列,每个列上是对应的数据。一行就是一个向量。 我们要做的就是找寻一个方法,使得一封邮件的文字内容最终变成一个向量。 好在前人已经为了提供了成熟的思考方式。