论文研究基于分布式数据仓库的分类分析研究.pdf
针对GAC-RDB分类算法只能应用于单机版数据仓库的局限性,为了能够更方便、快捷地在云计算平台上开展数据挖掘工作,基于分布式数据仓库HBase,结合GAC-RDB分类算法的实现机理,制定适合分布式平台的运行策略,使用原生HiveQL语言提出了一种分布式GAC-RDB分类算法。实验显示,随着集群中节点的不断增加,算法的运行时间稳步下降。结果表明,在保证算法准确率的前提下,分布式数据仓库能够有效提高GAC-RDB分类算法的扩展性和运行效率,相对于MapReduce框架,HiveQL语言降低了对数据挖掘从业人员的技术要求,更大程度地减少了算法的开发时间,为挖掘海量数据提供了新的解决方案。
用户评论
推荐下载
-
论文研究基于Web的分布式数据仓库体系结构的研究.pdf
随着数据仓库技术的发展,人们对数据仓库体系结构研究的兴趣越来越浓厚,数据仓库体系结构选取是否合理,将直接关系到整个数据仓库的成败。在分析客户机、服务器数据仓库体系结构的基础上,将XML、智能Agent
30 2019-09-14 -
分布式数据仓库
南大通用数据公司,分布式数据仓库的概念,架构和案例
28 2019-03-14 -
论文研究企业环境下分布式数据仓库的设计与实现.pdf
企业环境下分布式数据仓库的设计与实现,高鑫磊,吕玉琴,随着数据库应用系统的迅速普及和企业界需求的多样化、复杂化,企业需要大型的数据仓库来存储和分析海量数据。数据仓库在收集各种
17 2020-06-11 -
OLAP分布式商业数据仓库
在介绍OLAP(On-Line Analytical Processing)技术和数据仓库的基础上,分析了物流数据仓库的应用,给出物流信息数据采集流程、物流信息平台开发流程和决策支持子系统结构模型。对
29 2019-02-18 -
分布式数据仓库Hive大全
1. HIVE结构 6 1.1 HIVE架构 6 1.2 Hive 和 Hadoop 关系 7 1.3 Hive 和普通关系数据库的异同 8 1.4 HIVE元数据库 9 1.4.1 DERBY 9
34 2019-03-14 -
论文研究基于MapReduce的分布式音频分类技术研究.pdf
基于MapReduce的分布式音频分类技术研究,张凤羽,刘亮,音频信息在人们生活中占据着十分重要的地位,从大量的音频文件中提取出关注的音频片段在多媒体检索和智能监控等领域都有着广泛的
37 2019-09-26 -
论文研究基于分布式的大数据集聚类分析.pdf
为了提高聚类效率提出了一种基于分布式的大数据集聚类算法。该方法并不是一次性对所有的数据进行聚类,而是将大数据集随机分成若干个子集,对每个子集同时进行聚类,最后进行类的合并。实验结果表明大多数情况下该方
13 2020-07-16 -
论文研究基于遥感卫星数据的分布式处理研究.pdf
基于遥感卫星数据的分布式处理研究,李硕,杨正球,本研究主要介绍了在对海量遥感卫星数据的加工生产中的分布式并行处理方法,用于解决现有遥感卫星数据分布式并发处理平台只适用于
32 2019-09-04 -
腾讯分布式数据仓库TDW解析
Tencent distributed data warehouse TDW analysis
22 2019-06-21 -
分布式数据仓库PPT.pptx
分布式数据仓库PPT.pptx
7 2023-01-06
暂无评论