前言 随着互联网的不断发展和日益普及,网上的信息量在爆炸性增长,在2004年4月,全球Web页面的数目已经超过40亿,中国的网页数估计也超过了3亿。目前人们从网上获得信息的主要工具是浏览器,而通过浏览器得到信息通常有三种方式。第一,直接向浏览器输入一个关心的网址(URL),例如http://net.pku.edu.cn,浏览器返回所请求的网页,根据该网页内容及其包含的超链文字(anchor text)的引导,获得自己需要的内容;第二,登录到某个知名门户网站,例如http://www.yahoo.com,根据该网站提供的分类目录和相关链接,逐步“冲浪”浏览,寻找自己感兴趣的东西;第三,登录