基于语义和规则的Web网页细粒度信息抽取方法
本文在利用语义和规则的基础上,提出了一个Web网页信息细粒度抽取的方法。方法首先,利用Web网页的结构和HTML标签信息进行网页的粗粒度信息抽取;其次,结合网页标签、结构和文本语义将粗粒度信息进行文本标识和分割,形成语义上紧密相关的标识文本;然后,根据语义解释器,依次识别出文本中的属性项;最后利用语义和规则,确定属性和属性值对。实验证明,该方法逐步细化分解网页,有效的利用了网页潜在的语义信息,拥有不依赖网页类型、结构,适用性好的优点。实验表明该方法提取正文细粒度精确度达到了90%。
用户评论
推荐下载
-
基于WEB的快速信息抽取技术的研究和实现
基于WEB的快速信息抽取技术的研究和实现
35 2018-12-08 -
基于语义结构的信息抽取系统的研究与实现
基于语义结构的信息抽取系统的研究与实现,是关于信息抽取方面的内容,重点在于基于语义方面的信息抽取系统!
32 2018-12-08 -
动态代理加注解实现细粒度的权限管理具体到方法前面上传的资源修改
动态代理加注解实现细粒度的权限管理,具体到方法(前面上传的资源修改)
16 2019-05-01 -
基于细粒度数据流架构的稀疏神经网络全连接层加速.pdf
基于细粒度数据流架构的稀疏神经网络全连接层加速.pdf
5 2020-08-18 -
基于子树广度的Web信息抽取.pdf
基于子树广度的Web信息抽取.pdf
12 2021-01-30 -
面向细粒度图像分类的双线性残差注意力网络
细粒度图像之间具有高度相似的外观,其差异往往体现在局部区域,提取具有判别性的局部特征成为影响细粒度分类性能的关键。引入注意力机制的方法是解决上述问题的常见策略,为此,在双线性卷积神经网络模型的基础上,
9 2021-01-31 -
论文研究一种细粒度控制权限委托的SPKI方案.pdf
一种细粒度控制权限委托的SPKI方案,刘成,,SPKI是一种面向密钥的分布式网络访问控制技术,其权限委托机制在提高权限控制灵活度的同时也为SPKI技术带来了权限委托的精度控制方�
17 2020-05-14 -
WEB信息抽取的研究
Research on WEB Information Extraction
28 2019-06-28 -
论文研究基于动态网页分段的信息抽取方法.pdf
基于动态网页分段的信息抽取方法,戴昌林,高志强,一些基于HTML标记的信息抽取系统,不能自动获取抽取到的信息的语义。动态网页存在一些提示语义的字符串,可以用来网页分段,也可��
23 2019-09-12 -
细粒度的情感SST5数据集上五类情感分类的不同NLP方法的比较和讨论源码
细粒度情感分类 此仓库显示了对各种NLP方法的比较和讨论,这些方法可以在(SST-5)数据集上执行5级情感分类。 目标是使用多个基于规则,基于线性和神经网络的分类器来预测此数据集上的类,并查看它们之间
231 2021-03-06
暂无评论