网页解析器

StriveToday 16 0 PDF 2020-09-11 22:09:02

本文详细介绍了网页信息解析的各种技术手段,并且针对新闻网页,提出了两种解析方案:一.采用面向对象的设计理念,提出了基于模板的网页信息抽取方案;二.提出了基于网页结构分析的信息抽取方案。文中详细讨论了这两套系统的算法及其实现,并探讨了两套系统各自的有缺点。最后并提出了一些新的设想、展望、以及改进方案。

用户评论
请输入评论内容
评分:
Generic placeholder image 卡了网匿名网友 2020-09-11 22:09:03

介绍的很详细,便于学习实现。