因需要将impala仅仅作为数据源使用,而python有较好的数据分析函数,所以需要使用python客户端来获取impala中的表数据,这里的测试环境是: 操作系统:win7 (linux下也可行) python 2.7 大数据环境:centos6.6 CDH版本:CDH5.4.1 impala 2.1.2 port:21050 1、安装Python package pip install impyla 2、python客户端与impala交互 2.1 连接impala >>> from impala.dbapi import connect >>> conn = connect(hos