fathom:从网页中提取含义的框架 源码

familiarise_41126 10 0 ZIP 2021-04-08 22:04:04

捉摸 Fathom是一种监督式学习系统,用于识别网页的某些部分(弹出窗口,地址表,幻灯片)或对页面进行整体分类。 DOM流入一侧,而DOM节点流出另一侧,并标记有类型和这些类型正确的概率。 类似Prolog的语言可以很容易地指定建议每种类型的“气味”,而基于神经网络的培训师可以确定每种气味的最佳贡献。 最后,FathomFox Web扩展使您可以收集和标记一系列网页以进行培训。 继续阅读 。

用户评论
请输入评论内容
评分:
暂无评论