MapReduce框架下支持差分隐私保护的k means聚类方法
针对传统隐私保护方法无法应对任意背景知识下恶意分析的问题,提出了分布式环境下满足差分隐私的k-means算法。该算法利用MapReduce计算框架,由主任务控制k-means迭代执行;指派Mapper分任务独立并行计算各数据片中每条记录与聚类中心的距离并标记其属于的聚类;指派Reducer分任务计算同一聚类中的记录数量num和属性向量之和sum,并利用Laplace机制产生的噪声扰动num和sum,进而实现隐私保护。根据差分隐私的组合特性,从理论角度证明整个算法满足e差分隐私保护。实验结果证明了该方法在提高隐私性和时效性的-情况下,保证了较好的可用性。
用户评论
推荐下载
-
MapReduce框架下支持差分隐私保护的随机梯度下降算法
针对现有分布式计算环境下随机梯度下降算法存在效率性与私密性矛盾的问题,提出一种 MapReduce框架下满足差分隐私的随机梯度下降算法。该算法基于MapReduce框架,将数据随机分配到各个Map节点
15 2021-01-16 -
基于差分隐私保护的离群值消除k均值聚类算法
基于差分隐私保护的离群值消除k均值聚类算法
13 2021-05-09 -
基于聚类匿名化的差分隐私保护数据发布方法
基于匿名化技术的理论基础,采用DBSCAN聚类算法对数据记录进行聚类,实现将个体记录匿名化隐藏于一组记录中。为提高隐私保护程度,对匿名化划分的数据添加拉普拉斯噪声,扰动个体数据真实值,以实现差分隐私保
26 2021-01-16 -
MapReduce模糊聚类K_Means及其评估
使用MapReduce实现模糊聚类和K-Means算法,并且对其进行评估。
27 2019-01-18 -
k means聚类
K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似
13 2020-08-21 -
k_means聚类算法的MapReduce并行化实现
利用k_means聚类算法的MapReduce并行化实现,为学习hadoop的同学提供参考
33 2019-05-27 -
差分隐私保护综述
差分隐私保护是目前非常热的课题,一篇中文综述送给大家
48 2019-01-18 -
Opencv k means聚类
读入文本后,把文本中的数据读入,进行聚类输出。
20 2020-11-17 -
利用k prototype聚类的差分隐私混合数据发布算法
差分隐私是一种提供强大隐私保护的模型。在非交互框架下,数据管理者可发布采用差分隐私保护技术处理的数据集供研究人员进行挖掘分析。但是在数据发布过程中需要加入大量噪声,会破坏数据可用性。因此,提出了一种基
0 2024-10-05 -
K means聚类算法中聚类个数的方法研究
在数据挖掘算法中,K均值聚类算法是一种比较常见的无监督学习方法,簇间数据对象越相异,簇内数据对象越相似,说明该聚类效果越好。然而,簇个数的选取通常是由有经验的用户预先进行设定的参数。本文提出了一种能够
17 2021-02-01
暂无评论