本书是目前为止国内唯一一本阐述如何使用R语言来分析和挖掘互联网数据的应用性书籍。书中使用大量的实际案例,把数学原理同R语言实现方案有机的结合起来。力图通过案例分析使读者到达举一反三的效果,进而指导读者在日后的实际工作中进行应用。同时书中也阐述众多常用的数据分析和挖掘的方法和原理,对于非互联网的从业人员也很有指导意义。 全书共12章,第1~3章为基础内容,着重介绍数据分析挖掘的思路以及R语言如何处理数据并绘制图形。第4~5章介绍统计相关内容,主要针对互联网数据分析过程中如何对指标进行描述,如何进行异常监控、对比、趋势预测等分析进行了讲解。第6~10章着重介绍回归分析、分类分析、数据降维、聚类分析、关联分析、关系网络分析、文本分析的原理,结合大量的实际案例分析讲解了R语言的实现方案。第11~12章为高阶应用部分,主要讲解R语言如何通过Gtk插件完成GUI图形界面的搭建。 在当下大数据时代,越来越多的网站开始重视数据,期望从数据中寻找有价值的结论,指导公司管理层的决策,最终创造更大的网站价值。而在各种网站分析技术中,R语言作为一个可进行交互式数据分析和探索的强大平台,起着举足轻重的作用,R语言的免费开源使得很多公司用它来处理数据、分析数据、完成模型。使用R 语言可以进行网站数据系统的搭建,可以对累积的众多数据进行挖掘,找出其中的特征和规律。同时R语言是目前包含数据算法最全的工具,其灵活强大的绘图功能可以更好地表现数据处理结果。对于有志成为互联网数据挖掘/分析师的读者来说,掌握R语言将成为他们未来必备的技能之一。本书将R语言和网站分析/挖掘有机地结合起来,通过对大量案例进行详细阐述和深入分析,进而指导读者在实际工作中的应用。 本书的主要内容和特色: 本书包括大量的实际应用案例以及全部的R语言实现代码,通过对应用场景以及数学原理的分析,力图使读者在阅读过本书之后达到举一反三的效果。 本书在阐述实际案例的同时给出了其原始数据集的结构、应用场景以及结论分析,做到从“目标变量的抽象”、“数据预处理”直至最后“模型性能评估”的全流程讲解。 在讲解R语言函数时书中会给出详细的参数说明表以及数据挖掘原理,使读者不仅知其然,更能知其所以然。书中对数学原理的阐述不仅仅对互联网从业者有用,对于非互联网行业的数据从业人员也是有益处的。 本书的灵魂是互联网数据应用,所以在案例讲解过程中均会加入结论性分析,进而帮助数据分析师提高“如何利用结果数据指导实际商务决策”的能力。 全书对于具有互联网行业特点的“关系网络分析”和“文本分析”也做了较为详细的讲解。 《R语言与网站分析》从互联网应用角度对R语言如何实现数据挖掘和指标分析等问题做了阐述。通过诸多真实应用案例的分析,作者试图为读者建立起一座沟通数学原理和互联网实际业务应用的桥梁。同时本书给出了案例中的完整代码以及分析过程,力图帮助读者充分理解R语言是如何实现算法的。, 《R语言与网站分析》是目前为止国内唯一一本阐述如何使用R语言来分析和挖掘互联网数据的应用性书籍。书中使用大量的实际案例,把数学原理同R语言实现方案有机结合起来。力图通过案例分析达到举一反三的效果,进而指导读者在日后的实际工作中进行应用。同时书中也阐述众多常用的数据分析和挖掘的方法和原理,对于非互联网的从业人员也很有指导意义