随着全球网络的普及应用,大童没有统一结构和管理的在线资源 急需 进行处理,高效的网页自动分类方法是从网上海童信息中提取所需信息的关健技术,特征选取又是文本分类挖掘 的重要基础 ,本文以广义信息论为理论墓础 ,提出了墓于二次嫡的互信志特征选取方法,独立评话特征集中的每个特征,分析特征和类别的关系,从高维的特征空间 中选取出衬文本分类有效的特征,降低了文本特征空间的维数,提高了文本分类的性能