针对传统但技术成熟的信息挖掘方法具有扩展性较差、挖掘范围窄、效率低等问题,文中设计开发了一套包含了Web文本采集和分类模块以及类别判断模块的网络信息安全防范与Web数据挖掘系统。该系统包括Web文本采集和分类模块以及类别判断模块。Web文本采集模块负责采集互联网中Web网页上存在的文本信息数据,并将其传递给Web文本分类模块。Web文本分类模块又可分为分类器、分类模块和训练模块3部分,是该系统的核心模块,主要负责对Web文本进行分类。类别判断模块负责判断网络文本信息是否应被归入不安全信息类,并针对不同判断结果做出相应的处理。经过实验测试,文中设计的系统挖掘数据性能良好,在检测不安全信息