基于支持向量机与无监督聚类相结合的中文网页分类器 提出了一种将支持向量机与无监督聚类相结合的新分类算法, 给出了一种新的网页表示方法并应用于网页 分类问题. 该算法首先利用无监督聚类分别对训练集中正例和反例聚类, 然后挑选一些例子训练 SVM 并获得SVM 分类器. 任何网页可以通过比较其与聚类中心的距离决定采用无监督聚类方法或 SVM 分类器进行
基于内容的中文网页自动分类研究 摘 要:本文主要介绍基于内容的网页自动分类系统,具体介绍了类别词典的建造方法, 网页超文本类别 词切分的方法,中文网页自动分类算法以及利用类别词与网页间的模糊关系对网页文本进行自动分类等内 容.通过对旅游网页进行测试, 自动分类正确率可达 93. 37 %以上,有效地提高了查准率和查全率.