BigData项目使用Sqoop与Hive管理NYSE数据
Sqoop+Hive+MySQL 项目将演示以下在 CDH5 中使用 sqoop 的核心概念:在 MySQL 中创建表,将 NYSE 数据导入 MySQL;利用 Sqoop 将数据从 MySQL 导入 Hive;在 Hive 中操作数据来计算每个股票代码的股票量,将此数据存储到 Hive 上的 stock_volume 表中;使用 Sqoop 将此数据从 Hive 导出回 MySQL 以生成报告。项目开发过程中,还计划设计用于导入、数据操作和导出的 Oozie 脚本,从 MySQL 输出中读取信息并生成数据报告的 UI。
文件信息
NYSE Hadoop 文档包含导入和导出数据的所有步骤和命令,以及分步指南。 tar 文件 包含项目使用的示例数据,能够很好地表示整体数据。