1 Web挖掘 Web挖掘是指运用数据挖掘技术从Web页面中发现和抽取信息的过程。Web挖掘又分为3种类型:Web使用挖掘、Web结构挖掘和Web内容挖掘。Web使用挖掘的数据源主要是Web日志文件,通过挖掘Web日志可以了解用户的访问模式。基于用户的访问模式,可以对网站的链接进行相应的修正;了解用户兴趣,为用户定制个性化的页面;进行用户分类,对不同的用户实行不同的促销策略,提高投资回报率;向用户推荐Web页面等。 2 数据预处理 数据预处理是Web使用挖掘的第一个环节。预处理的对象是Web 日志文件。由于Web 日志文件的格式是半结构化的,且日志中的数据不够完整,因此