Ta上传的资源 (0)

编程之美,编程编到极致,就有艺术的感觉,就有美的感觉;值得一看的一本书。

IBM数据生成器,seq类型,适合用于关联分析生成事务数据库,方便快捷;其中类似T40I10D100K的数据就是通过IBM数据生成器生成的。使用方法:bin/seq_data_generatorseq[options]

《深入理解大数据》一书的源代码,里面包含许多经典例子的代码,java实现,易读性强,包含MapReduce的K-Means聚类算法、KNN最近邻分类算法、朴素贝叶斯分类算法、决策树分类算法等,还有基于MapReduce的搜索引擎算法、大规模基因序列化比对算法、重复文档检测算法等

《大数据时代》这本书,在所谓的大数据时代,描述了很多关于大数据时代带来的不同于以往互联网的影响,值得一读。mobi格式。