基于Hadoop集群的多表并行关联算法及应用
针对因特网环境下并行数据库实现多个大数据表关联存在的计算瓶颈,基于 Hadoop集群设计了一个并行关联多个大数据表的简便算法MR_Join。以商业网站凡客诚品的销售数据为例进行实验,验证算法的可行性并做出应用实例。实验结果表明,MR_Join算法可以有效地实现大数据表的快速关联,具有显著的并行效率。
用户评论
推荐下载
-
hadoop集群环境的搭建
Hadoop cluster environment
37 2019-06-22 -
搭建高效的Hadoop集群
搭建高效的Hadoop集群是实现大规模数据处理的关键步骤之一。首先,确保集群中的每个节点都能够稳定运行,这包括正确的网络配置和主机名解析。只有在服务器之间建立了可靠的通信通道,集群才能正常协同工作。
14 2023-11-18 -
hadoop集群的搭建apache
详细的介绍了在hadoop的安装过程,附带每一步的截图,适合于初学者,以及重点介绍了mapreduce的原理以及简单地应用实例。
47 2018-12-29 -
Hadoop集群的搭建.docx
常见的启动错误 错误:启动完后,namenode的主机上没有出现namenode进程。 原因:没有进行namenode初始化。只初始化一次,以后不要初始化了。 错误:启动完后,datanode的主机上
37 2020-08-10 -
kettle集群并行分区
kettle 集群& 并行& 分区 的介绍,是kettle solution ..的中文版
67 2018-12-26 -
论文研究一种快速并行关联规则算法研究及仿真.pdf
在比较了当前几种并行关联规则挖掘算法的基础上,对并行关联规则算法进行了比较全面的分析,为了解决其性能和效率方面存在的问题,提出了一种快速挖掘策略的并行处理算法(FPARM),并对这种快速并行关联规则算
31 2019-09-14 -
matlab灰关联算法应用
matlab之灰色系统理论及其应用教程,适用于初学者学习用资料
11 2021-04-28 -
SQL update多表关联更新的实现代码
实现多表更新,尤其是A表和A的子表B表数据更新,下面是例子 有A、B张表,其记录如下: A表 c1 c2 ————– 1 a1 2 a2 3 a3 8
13 2020-12-31 -
Django ORM图书管理系统的多表关联
本文将介绍如何使用Django-ORM创建一个多表关联的图书管理系统。首先,我们需要了解Django-ORM是什么以及它在图书管理系统中的作用。然后,我们将讨论如何设计数据模型并建立表之间的关联。接着
6 2023-09-02 -
浅谈Linqtosql的多表关联与动态条件查询
浅谈Linq to sql 的多表关联与动态条件查询
35 2019-01-07
暂无评论