介绍了假日旅游信息数据挖掘的概念,提出了一种改进的分布式抽样关联规则挖掘算法DS-ARM,给出了算法的实现过程,并对算法性能进行了测试,利用DS-ARM算法对假日旅游者在目的地的旅游行为模式进行了研究
:通过分析数据关联的特点和已有的关联规则挖掘算法,在定量描述的准确性和算法高效性方面作了进一步研究,提出了更准确的支持度和置信度定量描述方法和关联关系强弱的定量描述方法。同时,改进了FP-growth
随着Internet的迅猛发展,人们对事件的立场、观点和看法的文本信息每天都会在网上出现,对于这些评论,仅靠人工进行跟踪和分析显然是行不通的,人们开始关注并研究评论文本的主观性情感倾向分析。文本情感分
k-means算法接受参数k;然后将事先输入的n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个
文本聚类是文本挖掘的一项重要技术,可广泛应用于文本挖掘与信息检索等方面,在大规模文本集的组织与浏览、文本集层次归类的自动生成等方面都具有重要的应用价值。但是,传统的文本聚类算法忽略了文本中单词之间的语
基于遗传算法的文本聚类技术研究遗传算法文本聚类
基于mapreduce的聚类算法研究,云计算环境下基于hadoopmapreduce编程模型下,聚类算法实现论文。
聚类算法是一种在机器学习领域广泛应用的方法,它通过将数据集分成不同的群组来发现数据的内在结构。本文通过对不同聚类算法的研究进行综述和分析,总结了各种聚类算法的原理、优缺点以及在各个领域中的应用情况。同
Master-Worker模式的并行关联规则挖掘算法,苗锡奎,,随着信息技术迅速发展,数据库的规模不断扩大,从而产生了大量的数据。如果使用传统的数据挖掘技术从这庞大的数据中挖掘出有价值
论文研究-改进的增量式关联规则维护算法.pdf, 在分析现有的关联规则算法IUA的基础上,指出了该算法的不足和错误之处,并加以改正,进而提出了一种改进的增量式更新算法EIUA.EIUA算法解决了在数据