数据算法HadoopSpark大数据处理技巧美马哈默德·帕瑞斯安
数据算法_Hadoop Spark大数据处理技巧_(美)马哈默德·帕瑞斯安
《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。, 主要内容包括:, ■ 完成超大量交易的购物篮分析。, ■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。, ■ 使用超大基因组数据完成DNA和RNA测序。, ■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。, ■ 推荐算法和成对文档相似性。, ■ 线性回归、Cox回归和皮尔逊(Pearson)相关分析。, ■ 等位基因频率和DNA挖掘。, ■ 社交网络分析(推荐系统、三角形计数和情感分析)。
推荐下载
-
Hadoop大数据处理方面的文献
基于Hadoop的大数据处理技术,包括原理介绍、数据处理流程等
35 2019-09-22 -
Spark大数据处理系列之MachineLearning
最近几年,机器学习、预测分析和数据科学主题得到了广泛的关注。Spark的机器学习库(Spark MLlib),包括各种机器学习算法:协同过滤算法、聚类算法、分类算法和其他算法。在前面的《Spark大数
10 2021-02-01 -
大数据处理利器pwwMap完美哈希
大数据处理利器pwwMap完美哈希没有碰撞完全取代各种map
13 2020-05-17 -
最新mongodb大数据处理权威指南
最新mongodb大数据处理权威,绝对超值,亲测,高清,完整标签,已读。
44 2019-02-17 -
大数据处理与舆情监控简介
大数据处理与舆情监控简介主要介绍了基于大数据处理的舆情监控及其应用简介
34 2019-05-15 -
大数据处理及其研究进展
大数据BigData是指大小超出了常用的软件工具在运行时间内可以承受的收集,管理和处理数据能力的数据集;大数据是目前存储模式与能力、计算模式与能力不能满足存储与处理现有数据集规模产生的相对概念。主要完
18 2021-04-24 -
大数据处理hive深入详解.pdf
Hive是基于Hadoop的数据仓库解决方案。由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用Hive构建的数据仓库也秉承了这些特性。
11 2020-07-29 -
大数据处理器2源码
BigDataProcessor2(BDP2)是插件,用于交互式处理TB大小的图像数据。 BDP2使用进行渲染,并使用库进行图像处理。 该BDP2是新版本 。 主要特点: TB大小的图像数据的 TB大
8 2021-02-27 -
大数据处理介绍_基础知识
大数据处理介绍-基础知识讲座 安装 配置 详细讲解
28 2019-01-02 -
7个有效提高大数据处理效率的技巧.pdf
大数据处理是当今互联网时代必要的一项技能。为了更好地应对数据规模庞大的挑战,以下是7个有效提高大数据处理效率的技巧。数据分片:将庞大的数据集分割成更小的片段,以提高处理速度和效率。并行处理:利用
4 2023-07-24
用户评论