big_data:有关HadoopMapReduceSparkDocker的教程的集合源码

mention_4777 7 0 ZIP 2021-02-06 06:02:26

初学者的大数据有关Hadoop,Spark等的一些教程和演示,主要是Jupyter笔记本的形式。使用MapReduce Streaming和bash创建映射器和化的MapReduce简介一个非常基本的MapReduce单词计数示例一个简单的MapReduce作业,带有mrjob Hadoop溢出解释演示,用于对Hadoop集群进行基准测试面向初学者的Docker:容器世界入门 Pyspark基本演示使用pyspark生成ngram的基本示例编码Spark数据框列探索Unicode类别( ) 用numpy算出多项式回归的示例使用Faker Python库生成假数据

文件列表

big_data-master.zip (预估有个26文件)

big_data-master

HDFS_Architecture.svg 11KB

docker_for_beginners.md 21KB

mapreduce.png 29KB

generate_data_with_Faker.ipynb 27KB

shuffle_sort.svg 38KB

NgramsAHPC.ipynb 11KB

TestDFSio.ipynb 17KB

mapreduce.svg 22KB

mrjob_wordcount.ipynb 15KB

Unicode.ipynb 4.49MB

data-1600cols.csv 3.06MB

PySpark_SQL_Cheat_Sheet_Python.pdf 678KB

LICENSE 1KB

environment.yml 150B

README.md 1KB

ngrams_with_pyspark.ipynb 5KB

polynomial_regression.ipynb 56KB

Encoding+dataframe+columns.ipynb 28KB

pi.py 1KB

HDFS_Architecture.png 22KB

Hadoop_spilling.ipynb 10KB

pi.slrm 417B

mapreduce_with_bash.ipynb 61KB

demoSparkSQLPython.ipynb 20KB

simplest_mapreduce_bash_wordcount.ipynb 2KB

shuffle_sort.png 20KB

用户评论

暂无评论

big_data大数据实验室的任务源码

大数据大数据实验室的任务 Stanford网络图( )用于实验5中的某些任务。实验1: Task: - Building wordcloud from words in a book 实验2: T

8 2021-02-22
Security with Intelligent Computing and Big_data Services_Springer2018.pdf

The purpose of 2017 International Conference on Security with Intelligent Computing and Big-data Ser

26 2019-03-17
Ngulik Big Data与数据处理有关的提示和技巧源码

Ngulik大数据 Kumpulan Resep Pengolahan数据和人工智能 pySpark 蜂巢 Python 数据可视化

2 2021-02-23
big data project源码

大数据项目安装Docker和Docker-compose 查看链接启动数据库运行以下命令: docker-compose up -d 数据数据中有一些放错位置的选项卡,要解决此问题,您必须使用

14 2021-04-04
ecommerce big data源码

来自多类别商店的电子商务行为数据该数据集包含来自电子商务网站的6700万用户事件怎么看有不同类型的事件。见下文。财产描述 event_time 事件发生的时间(以UTC为单位)。事件类型

17 2021-04-19
从非结构化数据到大数据Big_Data整体解决方案

Oracle专家对现在的非结构化数据存储及大数据应用的经典分析及讲解。可以快速开阔您的视野。现在分享给需要的朋友。

40 2018-12-07
Big Data

Big data 介绍 .最新的Big data技术

62 2018-12-09
Data Mining with Big Data

This paper presents a HACE theorem that characterizes the features of the Big Data revolution, and p

75 2018-12-09
Big_Data_Programming源码

大数据编程 ICP-1 Wiki链接: : ICP-2 Wiki链接: : ICP-3 Wiki链接: :

5 2021-03-29
Big data visualization system源码

大数据可视化系统 (基于用户行为的数据可视化系统) 开发环境 JDK:1.7 框架:spring 4.2.5 + mybatis 3.2.8 最佳条件: 原始数据的收集:将应用的每个页面的每个动作抽象

16 2021-03-21

big_data:有关HadoopMapReduceSparkDocker的教程的集合 源码

文件列表

用户评论

推荐下载

big_data:有关HadoopMapReduceSparkDocker的教程的集合源码