论文研究文本挖掘中一种基于参数估计的语句分块方案研究.pdf

wsrwsrriri 11 0 PDF 2020-08-07 20:08:51

若想从文本中获得高质量信息,一般来讲需要处理大量数据集,还需使用自然语言处理方法及参数估计统计模型。针对该问题,首先针对数据遵守幂律分布的统计参数估计模型进行了优化;然后提出一种统计学方法用于文本挖掘中的语句分块,通过迭代估计词组概率,将大型语料库中的语句分成更小的有意义词组。该方法要求生成并存储大量词组频率数据,并在每次迭代时支持计算节点快速访问数据。实验评估表明,该方案显著降低了远程数据库查询次数,其端到端应用运行时间要比只基于HBase的原始分布式部署快出6倍。

资源预览

用户评论

暂无评论

论文研究一种高效的随机分块图像隐写算法.pdf

嵌入效率高和隐藏信息量大的信息隐藏算法，已成为信息安全领域研究的一个热点。通过对该类信息隐藏算法的分析，提出了一种高效率的随机分块信息隐藏算法ERS（an Efficient high payload

14 2020-07-16
论文研究基于跳跃滤波和时变参数估计的中国股市微观结构研究.pdf

论文研究-基于跳跃滤波和时变参数估计的中国股市微观结构研究.pdf, 为了更为有效地探究微观市场结构对股票价格的影响，本文在状态空间模型框架下，同时将交易方向、带方向的交易量、交易间隔、微观噪声以及

24 2020-07-17
论文研究一种新的关联规则挖掘方法.pdf

关联规则挖掘是数据挖掘的主要任务之一。为了进一步提高关联规则挖掘算法的认知特性和运算效果，提出了一种新的关联规则挖掘思想并由此构造了一种基于规则模糊认知图的关联规则挖掘算法。该算法使用规则模糊认知图进

26 2019-09-25
论文研究一种新型的工控漏洞挖掘方法.pdf

一种新型的工控漏洞挖掘方法，于长奇，李祺，震网事件发生以后，工业控制系统安全问题受到了广泛关注。安全问题的核心就是漏洞，工业控制系统安全事件层出不穷的本质也是工控

13 2020-03-26
论文研究一种局部最优社区挖掘方法.pdf

研究互联网论坛中划分用户社区问题。首先通过分析用户在论坛上的发言层次结构与内容建立用户之间的回复关系图，然后提出一种基于局部最优的图聚类方法LOGCA对大容量的论坛网络图进行分类。实验得到互联网论坛上

32 2019-09-04
论文研究一种多约束关联挖掘算法.pdf

约束关联挖掘是在把项或项集限制在用户给定的某一条件或多个条件下的关联挖掘，是一种重要的关联挖掘类型，在现实中有着不少的应用。但由于大多数算法处理的约束条件类型单一，提出一种多约束关联挖掘算法。该算法以

11 2020-07-18
论文研究VANET中一种基于时隙的优先转发紧急警示消息方案.pdf

VANET中一种基于时隙的优先转发紧急警示消息方案，孙海霞，胡永，本文提出了一种基于时隙的优先转发紧急警示消息 (time-slotted-based forwarding priority-emer

11 2020-07-19
论文研究一种基于Jafarkhani码的协作通信方案.pdf

一种基于Jafarkhani码的协作通信方案，郭海艳，郭迎，本文提出一种基于Jafarkhani码的协作通信方案，此方案在源节点使用OFDM调制，在中继节点通过简单的时间逆转或复共轭处理后将信号转发�

23 2020-03-05
论文研究一种基于Docker的灾难恢复方案.pdf

一种基于Docker的灾难恢复方案，李蒙，彭扬，目前的灾难备份系统大多是在异地建立同等规模的数据中心，或者采用云灾备的方式。异地数据中心灾备对于资源浪费非常严重，需要耗

9 2020-07-16
论文研究一种基于IOCP的文件传输方案.pdf

一种基于IOCP的文件传输方案，王昕，汤南松，在数字化时代，文件传输是一项基本并且重要的功能。本文提出了一种基于Winsock库、IOCP模型，结合特有的Bitmap结构和滑动窗口机制的文�

17 2020-04-22

论文研究 文本挖掘中一种基于参数估计的语句分块方案研究.pdf

资源预览

用户评论

推荐下载

论文研究文本挖掘中一种基于参数估计的语句分块方案研究.pdf