在文档分类中整个文档是一个实例文档中的某些元素构成特征.我们可以观察文档中出现的词并把每个词作为一个特征而每个词的出现或者不出现作为该特征的值这样得到的特征数目就会和词汇表中的词一样多.贝叶斯决策的实质是在比较P D hP h的大小其中h指不同的类别比如在辨别是否为垃圾邮件的时候就分为垃圾邮件和非垃圾邮件两类