Ta上传的资源 (0)

Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。 Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

Hive是把一个查询转化成多个MapReduce任务,然后一个接一个执行。执行的中间结果通过对磁盘的读写来同步。然而,Presto没有使用MapReduce,它是通过一个定制的查询和执行引擎来完成的。它的所有的查询处理是在内存中,这也是它的性能很高的一个主要原因。

相信很多小伙伴和我一样,写hive的时候突然忘了某一个函数怎么弄,然后好不容易整理几个常用函数还不全面且零散,这里是我从网上贴下来大神总结的

olap动态报表制作包括3项技术(kylin+saiku+mondrian),本部分详细描述怎么用kylin做cube