Html网页正文提取 Html2Article.zip

u735696828 18 0 ZIP 2020-08-16 05:08:43

.NET平台下,一个高效的从Html中提取正文的工具。正文提取采用了基于文本密度的提取算法,支持从压缩的Html文档中提取正文,每个页面平均提取时间为30ms,正确率到95%以上。 Html2Article有如下特点: 标签无关,提取正文不依赖标签。支持从压缩的html文档中提取正文内容。支持带标签输出原始正文。核心算法简洁高效,平均提取时间在30ms左右。使用示例: /// /// 文章正文数据模型 /// public class Article { public string Title { get; s

文件列表

Html2Article-master.zip (预估有个35文件)

Html2Article-master

License.md 592B

.nuget

NuGet.targets 7KB

NuGet.Config 164B

src

Demo

FrmMain.Designer.cs 13KB

Program.cs 466B

FrmMain.cs 3KB

app.config 975B

FrmMain.resx 6KB

Properties

Resources.resx 5KB

Settings.settings 527B

AssemblyInfo.cs 1KB

Settings.Designer.cs 2KB

DataSources

Article.datasource 580B

Resources.Designer.cs 3KB

Demo.csproj 4KB

Html2Article

UrlUtility.cs 1KB

Html2Article.csproj 2KB

Html2Article.nuspec 686B

Html2Article.cs 13KB

Properties

AssemblyInfo.cs 1KB

Html2Article.Test

packages.config 129B

UrlUtilityTest.cs 645B

Html2Article.Test.csproj 3KB

Properties

AssemblyInfo.cs 1KB

.tfignore 5B

Html2Article.sln 4KB

.gitignore 227B

Html2Article.nuspec 966B

README.md 2KB

packages

repositories.config 137B

NUnit.2.6.2

license.txt 1KB

NUnit.2.6.2.nuspec 2KB

NUnit.2.6.2.nupkg 92KB

lib

nunit.framework.dll 144KB

nunit.framework.xml 556KB

用户评论

暂无评论

html网页教程学习html基础入门

html教程,我看过的觉得挺不错的,推荐看下,认为可以的话介绍给别人.

40 2019-09-04
HTML网页模板下载index.html

本文提供HTML网页模板下载 - index.html，适用于建站、设计、开发等领域。该模板具有响应式布局、清晰简洁的设计风格，易于修改和定制。欢迎大家下载使用。

147 2023-03-19
html基础html入门教程html网页制作基础

内含以下三个教程Dreamweaver8完美网页设计之HTML快速参考.chmhtml教程(详解).chmHTML完全手册.chm

48 2019-05-15
网页基础布局html5.zip

网页基础布局,内容都是自己搞的,跟任何大站没有任何关系,喜欢的可以拿去借鉴一下,希望能给你一个质的灵感,让你没有烦恼的学习html5,内容:(原创)

14 2020-10-07
html css网页练习作品.zip

此文件是使用HTML和CSS写的一个网页,整合了前面学习html和css中学到的大部分知识,是一个很有意思的项目,这一整套学习都是在b站中看的李立超老师的视频学习的,非常建议初学者看看:https

12 2020-08-22
旅游网网页HTML模板.zip

旅游网网页HTML模板.zip

22 2020-07-17
html网页游戏开心消消乐.zip

利用html5开发的经典小游戏系列4，网页游戏开心消消乐。里面包含了游戏开发代码，即下即玩，也适用于html5游戏开发者的入门学习

42 2020-07-17
静态html网页个人空间.zip

简单的HTML网页制作，静态，不包含动态，简单在简单不过

19 2020-05-25
HTML网页数字时钟代码.zip

HTML网页数字时钟代码基于Vue.js2.3.4制作，打开网页，动态显示日期、星期、时、分、秒。

7 2020-07-16
仿京东网页html源码下载.zip

仿京东网页html源码下载

22 2019-07-26

Html网页正文提取 Html2Article.zip

文件列表

用户评论

推荐下载