大数据挖掘主要算法.doc

choosy_20498 17 0 DOC 2020-12-15 04:12:22

标准 文案 朴素贝叶斯 有以下几个地方需要注意 1. 如果给出的特征向量长度可能不同这是需要归一化为通长度的向量这里以文本分类为例比如说是句子单词的话则长度为整个词汇量的长度对应位置是该单词出现的次数 2. 计算公式如下 ? 其中一项条件概率可以通过朴素贝叶斯条件独立展开要注意一点就是?的计算方法而由朴素贝叶斯的前提假设可知?=?因此一般有两种一种是在类别为ci的那些样本集中找到wj出现次数的总

用户评论
请输入评论内容
评分:
暂无评论