本书介绍了如何对非常大的数据集执行计算密集型分析,确定解决各种不同问题的最佳方法,创建和调试统计模型以及运行分析和评估结果的方法。