史鹏程的学术报告从数字图像处理的角度看网页内容提取 史鹏程博士从数字图像处理的角度出发,评估了现有的网页内容提取方法,并提出了一种新的方法,该方法基于图像检测和文本识别技术,能够有效从网络上提取各种类型的文本信息。文章内容详细,图文并茂,可供学术和工程界参考。