实时风险管理介绍:这是哥伦比亚大学大数据分析课程的项目。该项目由2个不同的工作组成,通过使用5分钟刻度数据查找风险价值(VaR)来实施风险管理一种是用Java编码的数据收集工作。另一种是寻找VaR的Python编写与计算工作。本项目将给出一个实施VaR的例子,不仅利用和集群计算平台,而且利用iPython的交互式分析功能实现其计算算法。我们使用了以下系统:谷歌云服务Apache Spark的主节点和工作节点、名称/辅助节点、数据节点。iPython用于交互式分析,并使用Pyspark模块进行设置。设置步骤包括远程访问服务器、Apache Hadoop以及Apache Spark软件包。数据采集模块:TickDataReadWrite.java文件用于收集数据并将它们写入Apache Hadoop分布式文件系统。