当今社会,互联网在人们的生活中扮演着越来越重要的角色。网页分类技术的出现可以极大地促进网络的发展和使用。一种基于SVM算法的网页分类系统,使用Java语言实现。系统包括网络源码提取、过滤、中文分词、词频统计、特征选择及生成特征向量等多个功能模块。通过事先预分类语料库,使用持久化的SVM模型对网页进行分类,系统可以得到良好的分类效果。系统的设计理念、功能模块及实现过程。关键词:网页分类系统,SVM算法,中文分词,特征选择,预分类