NULL 博文链接:https://caibinbupt.iteye.com/blog/1888654
介绍了在FACEBOOK 的中使用HADOOP 进行TASK 调度的情况
1、Hadoop 是什么 Hadoop是现阶段数据开发的基础,Hadoop通常是指一个更广泛的概念—-Hadoop生态圈(基于或关于Hadoop的大数据开发的各种软件环境) 是Apache公司使用Ja
java连接hadoop-mapreduce资料
Hadoop加mapreduce实战手册
HadoopMapReduceAPI,包含新版的mapreduceapi和旧版的mapreduceapi。
讨论如何优化mapreducejob的运行,从各个方面调整参数。
使用python写微博关注者之间,相似度最高的十个用户的mapreduce,代码有点粗糙,主要是给大家提供思路的,不同的问题是需要修改的。
用MapReduce实现TF-IDF,Hadoop版本是2.7.7,参考某教程亲自手写的,可以运行,有问题可以留言
Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高
用户评论