hadoop大数据处理例子
关于常用的一个hadoop的python脚本代码,包括两种字典,一种是file分发的,一种是靠输入并且,一起经过shuffle排序,再进行计算的。限于文件大小限制,只有代码,不包含字典文件,所以不能直接运行,请见谅
文件列表
2_siteappclickcount.rar
(预估有个11文件)
sourcestruct.py
2KB
my.py
84B
dictory.py
507B
mapper.py
3KB
sitetypeidentity.py
2KB
wrapper_map.sh
56B
signpacket.py
533B
sitetype_identity.py
1KB
hadoop.sh
1KB
environment.py
267B
暂无评论