Python执行hive sql

发布时间:2019-09-09 08:47:43编辑:auto阅读(3274)

    该python脚本是用于执行hive脚本的,需要设置hive的可执行环境变量,其实质转化为shell下命令 hive -e 'sql语句’ 的方式执行,然后把结果重定向到控制台显示。注:由于该脚本是直接调用shell中的hive命令,所以需要在安装hive的服务器上执行。

    使用前置条件:(1)安装hadoop和hive,并启动完hadoop;(2)已配置好hive的环境变量,确保在shell中能正常执行hive。

    #!/usr/bin/python
    #-*-coding:utf-8 -*-
    
    import subprocess
    import traceback
    
    sql = """
    # 书写hql脚本
    ;
    """
    cmd = 'hive -e """'+sql.replace('"', "\'")+'"""'
    print cmd
    try:
        p = subprocess.Popen(cmd, shell=True, stdout=subprocess.PIPE)
        while True:
            buff = p.stdout.readline()
            print buff
            if buff == '' and p.poll() != None:
                break
    
    except Exception,re:
        print "message is:%s" %(str(re))
        traceback.print_exc();
    

    脚本举例

    #!/usr/bin/python
    #-*-coding:utf-8 -*-
    import subprocess
    import traceback
    sql = """
      select * from app_tianhe_zym_item_reason_dtl_da where order_dt = '2016-01-26' limit 10;
    """
    cmd = 'hive -e """'+sql.replace('"', "\'")+'"""'
    print cmd
    try:
        p = subprocess.Popen(cmd, shell=True, stdout=subprocess.PIPE)
        while True:
            buff = p.stdout.readline()
            print buff
            if buff == '' and p.poll() != None:
                break
    except Exception,re:
        print "message is:%s" %(str(re))
        traceback.print_exc();
    

    这里写图片描述

关键字