在通过对结构挖掘和内容挖掘的理论研究和方法改进基础上,本章从实际应用的角度出发,分析具体的实际应用需求,设计和实现了基于结构挖掘和内容挖掘的站点垂直挖掘模型。站点垂直挖掘模型由一系列科学严谨的信息挖掘理论和方法构成,通过结构挖掘和内容挖掘,逐步将拥挤、充满噪声的无结构化站点信息转换简洁、扼要的结构化信息。模型选取招标网站作为主题站点进行实验。招标网页信息种类繁多,网页结构形式多变,正文包含半结构化和自由化文本,同时,实用性比较强,选取招标站点作为实例具有较好的参照性。