云环境下基于MapReduce的用户聚类研究与实现
基于大数据背景下海量数据人们无法理解,聚类效率低下等问题,采用MapReduce编程模型将Canopy聚类算法和K-means聚类算法在云环境中相结合,使之能够充分利用Hadoop集群的计算和存储能力。以淘宝网上海量的购买用户聚类作为应用背景,通过使用Hadoop平台的数据挖掘组件Mahout对用户聚类进行了实例研究,并给出了使用Mahout进行挖掘的一般步骤。结果表明,基于MapReduce的聚类算法在大规模数据集上具有较好的聚类质量和运行速度。
用户评论
推荐下载
-
论文研究基于kmeans聚类算法的研究.pdf
基于k-means聚类算法的研究,黄韬,刘胜辉,本文首先分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机��
62 2019-09-04 -
基于谱聚类的聚类集成算法
摘要谱聚类是近年来出现的一类性能优越的聚类算法,能对任意形状的数据进行聚类,但算法对尺度参数比较敏感,利用聚类集成良好的鲁棒性和泛化能力,本文提出了基于谱聚类的聚类集成算法.该算法首先利用谱聚类算法的
50 2019-09-28 -
分布式环境下保持隐私的聚类挖掘算法
论文:分布式环境下保持隐私的聚类挖掘算法
33 2019-01-11 -
论文研究基于混合聚类的本体分块与映射.pdf
中文网页分类技术是数据挖掘研究中的一个热点领域,而支持向量机(SVM)是一种高效的分类识别方法。首先给出了一个基于SVM的中文网页自动分类系统模型,详细介绍了分类过程中涉及的一些关键技术,其中包括网页
19 2020-07-17 -
论文研究基于密度与路径的稳健谱聚类.pdf
近年来,谱聚类在分类领域得到了广泛的研究,其中基于路径和基于密度的算法是两个重要的研究方向。虽然这两种算法在一些数据集上能取得较好的分类效果,但不能对一些特殊的数据集进行准确分类。融合了这两种方法的优
9 2020-07-22 -
地面点云分割与欧式聚类.zip
地面点云分割与欧式聚类.zip
11 2021-02-15 -
论文研究基于聚类算法的校园网用户行为分析研究.pdf
基于聚类算法的校园网用户行为分析研究,丁青,周留根,利用数据挖掘相关技术,针对后台计费服务器的数据库,基于K-means算法以校园网用户行为特征为对象来进行聚类分析,提出了几个校园��
21 2020-01-04 -
用户推荐Slope One算法与mapreduce hive实现
NULL 博文链接:https://coderplay.iteye.com/blog/468623
9 2020-08-23 -
论文研究基于用户行为的粒子群熵聚类用户群划分方法.pdf
基于用户行为的粒子群熵聚类用户群划分方法,陈睿杰,崔鸿雁,提出了一种基于用户行为的粒子群熵聚类用户群划分方法,在已有用户数据的基础上,将用户模型化,把每个用户群划分作为一个可行解��
16 2020-02-20 -
云环境下的安全
介绍了云计算环境下的的安全挑战,并给出了对应的解决方案
26 2019-09-14
暂无评论