随着信息技术的不断发展,特别是Internet应用的普及,网上信息成指数级增长,如何自动处理这些海量的信息,以有效地保留大的文本集合就成为了目前重要的研究课题。对文本进行有效管理的方法之一,就是将它们进行系统地分类,即文本自动分类问题。文本自动分类是一项重要的智能信息处理技术,是文本检索技术的基础,在新闻自动分类、电子会议、电子邮件自动分类和信息过滤等方面极具应用价值。本文试图用一种新的工具,即概念网络和主题概念树来解决文本分类的问题,它在一定程度上考虑了上下文对文本归类的影响。 1 概念网络和主题概念树 1.1 概念网络 概念网络是中国科学院自动化所综合信息系统研究中心在理论和