py hadoop tutorial:一起使用Python和Hadoop源材料 Source material

clarify_41689 20 0 ZIP 2021-04-18 08:04:47

py-hadoop教程一起使用Python和Hadoop源材料。依存关系这是一个使用Ibis和PySpark与Hadoop中存储的数据(特别是HDFS和Impala Table中的文件)进行交互的教程。您将需要访问Hadoop集群(或VM / Docker映像),具有python解释器(安装了requirements.txt中列出的软件包)以及spark 1.6.1 数据我们将使用已更正的每小时Wikipedia页面浏览统计信息: 。可以在[关于数据集的Wikitech Wiki页面上]找到有关数据源的更多文档。( ) 要在本地下载数据,请运行 mkdir pageviews-gz python grab_data.py 从该目录的根目录开始。然后创建所需的表,

文件列表

py-hadoop-tutorial-master.zip (预估有个14文件)

py-hadoop-tutorial-master

grab_data_locally.py 4KB

img

search-interface.png 68KB

pgvw2.png 40KB

pgvw3.png 79KB

trending-on-wikitrends.png 118KB

stackoverflow.png 254KB

pgvw1.png 21KB

LICENSE 11KB

README.md 976B

explore_data_ibis.py 5KB

outliers.py 4KB

explore_data_pyspark.py 2KB

move_to_hadoop.py 4KB

.gitignore 1KB

用户评论

暂无评论

使用elipse连接Hadoop

使用Eclipse去连接Hadoop集群所必须安装的插件，还可以在Window下的Eclipse来跑MapReduce任务

30 2018-12-31
Hadoop安装与使用

介绍了Hadoop的安装的环境搭建、安装步骤、基本配置与使用

20 2019-01-03
SourceCodeProxy与GitLink和Atlassian StashBitbucket服务器一起使用的代理服务Proxy source code

源代码代理版本0.1.0 背景当源代码代理服务尝试动态获取正确的文件版本时,可以将其与GitLink和Atlassian Stash / Bitbucket Server结合使用,以对来自Visu

3 2021-05-03
跟我一起学makefile跟我一起写Makefile.pdf

跟我一起学makefile\跟我一起写Makefile.pdf 跟我一起学makefile\跟我一起写Makefile.pdf 工程管理必备,本pdf融合了makefile官方守则及作者的经验,难得啊

26 2020-09-20
一个Spring MVC和Hibernate一起使用的个人暂存

一个Spring MVC和Hibernate一起使用的个人暂存(含jar包),在这里放着,自己用,大家用

8 2021-04-28
Hadoop学习统计上网流量源数据

Hadoop学习统计上网流量源数据，该文件可以帮助我们练习Hadoop的统计功能。

37 2019-09-04
Hadoop照亮Hadoop illuminated

大数据和ApacheHadoop简介。本书旨在使Hadoop知识不仅可以为技术含量高的人所用，而且可以为更多的读者所用。

19 2020-06-07
Hadoop实战Hadoop in Action

[Hadoop实战].(Hadoop.in.Action).Chuck.Lam.文字版.pdf

48 2019-09-24
hadoop2012纸件材料_1

hadoop 2012 纸件材料 VMWare IBM intel Etu

18 2019-03-09
与孩子一起学编程_python.zip

本书适合Python的初学者，从简单到复杂，一步步的教你学会如何使用Python脚本语言，并且将其应用到某些地方。

32 2019-08-19

py hadoop tutorial:一起使用Python和Hadoop源材料 Source material

文件列表

用户评论

推荐下载