巴蒂斯塔 Batista adalah Batch数据平台,Python,Spark,Airflow,Presto dalam lingkungan群集和berjalan diatas虚拟机。 平台硬件需求硬件/ PC /笔记本电脑/ Mac处理器setara core i5 dan ram最小16GB琼脂系统。 Dalam Project ini saya menggunakan Macbook Pro Retina核心i7 dengan ram 16GB。 数据平台数据库数据关系数据库数据库MySQL数据库数据库数据库数据库数据库数据库SQL数据库NoSQL数据库数据库MongoDB。 Untuk用例yang digunakan adalah时尚电子商务数据yang akan diambil dari MySQL dan数据发票采购dari文件excel untuk MongoD