RoadRunner算法是基于html页面格式的信息抽取算法,能够比较高效地准确抽取生成相似网页模型,并对类似网页进行信息抽取。