基于规则模型的通用网页正文提取组件 演示地址如下:http://202.110.133.114/tsegment/webanalyer.aspx属于早期作品,采用规则方法提出非正文内容,则认为留下的内容为正文。仅作简单技术演示之用,感谢TT同学提供的空间并帮我写的演示程序。该功能已封装成.NET组件,可提供程序直接调用,近期提供下载。