trophyzhu的所有下载-用户-卡了网

统计学习方法李航著高清版

本书全面系统地介绍了统计学习的主要方法，特别是监督学习方法，包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、em算法、隐马尔可夫模型和条件随机场等。除第1章概论和最后一章总结外，每章介绍一种方法。叙述从具体问题或实例入手，由浅入深，阐明思路，给出必要的数学

LSTM训练过程英文版

LSTM（LongShort-TermMemory）是长短期记忆网络，是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。LSTM已经在科技领域有了多种应用。基于LSTM的系统可以学习翻译语言、控制机器人、图像分析、文档摘要、语音识别图像识别、手写识别、控制聊天机器人、预

跟我一起写Makefile陈皓

make是一个命令工具，它解释Makefile中的指令（应该说是规则）。在Makefile文件中描述了整个工程所有文件的编译顺序、编译规则。Makefile有自己的书写格式、关键字、函数。像C语言有自己的格式、关键字和函数一样。而且在Makefile中可以使用系统shell所提供的任何命令来完成想要

Factorization Machines学习笔记

FactorizationMachines（简称FM）的算法，它可对任意的实值向量进行预测。其主要优点包括:1)可用于高度稀疏数据场景；2)具有线性的计算复杂度。本文将对FM框架进行简单介绍，并对其训练算法—随机梯度下降（SGD）法和交替最小二乘（ALS）法进行详细推导。

XGBoost原理陈天奇高清

xgboost是大规模并行boostedtree的工具，它是目前最快最好的开源boostedtree工具包，比常见的工具包快10倍以上。在数据科学方面，有大量kaggle选手选用它进行数据挖掘比赛，其中包括两个以上kaggle比赛的夺冠方案。在工业界规模方面，xgboost的分布式版本有广泛的可移植

最优化理论与方法_袁亚湘高清

这是一本博士教材，里面详细地阐述了常用的最优化原理及算法，推到过程非常详尽，适合作为机器学习及深度学习的基础知识。

LDA数学八卦

在 Machine Learning 中，LDA 是两个常用模型的简称： Linear Discriminant Analysis 和 Latent Dirichlet Allocation，在这篇文章中我们主要八卦的是后者。LDA 是一个在文本建模中很著名的模型，类似于 SVD, PLSA 等模型

Scala编程完整版高清

Scala是一门多范式的编程语言，一种类似java的编程语言，设计初衷是实现可伸缩的语言、并集成面向对象编程和函数式编程的各种特性。本书介绍了一种新的编程语言，它把面向对象和函数式编程概念有机地结合为整体，从而形成一种完整统一、语义丰富的新思维体系。本书循序渐进，由浅入深，经作者精心组织、仔细

AGradientBoostingMachine

GBDT(Gradient Boosting Decision Tree) 又叫 MART（Multiple Additive Regression Tree)，是一种迭代的决策树算法，该算法由多棵决策树组成，所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力（genera

HadoopSpark大数据处理技巧中文版高清

《数据算法：Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案，以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。