这是一个已经写好编译好现成的udf文件,里面有使用手册,解决impala截取中文与英文并存问题。目前,impala的substr函数及substring函数都不支持中文的截取,因此,需要通过udf函数实现。对于impala udf函数,可以采用C++ 和 Java , 但出于效率考虑,一般采用c++。