1. Python을 사용하여 Hive에 연결하기 전에 Hive 설치 패키지 아래 lib/py에 있는 파일을 Python의 sys.path에 있는 site-packages에 복사해야 합니다. 그렇지 않으면 해당 패키지를 도입할 때 오류가 보고됩니다. . 하이브에서 제공하는 Python 인터페이스를 사용하여 하이브 클라이언트를 호출합니다.
2 하이브 절약 시작
다음 서비스가 활성화되어 있는지 확인하세요.
hive --service hiveserver
기본 포트는 10000입니다
from hive_service import ThriftHive from thrift import Thrift from thrift.transport import TSocket from thrift.transport import TTransport from thrift.protocol import TBinaryProtocol def ReadHiveTest(sql): try: tSocket = TSocket.TSocket('172.18.1.88',10000) tTransport = TTransport.TBufferedTransport(tSocket) protocol = TBinaryProtocol.TBinaryProtocol(tTransport) client = ThriftHive.Client(protocol) tTransport.open() client.execute(sql) return client.fetchAll() except Thrift.TException, tx: print '%s' % (tx.message) finally: tTransport.close() if __name__ == '__main__': showDatabasesSql = 'show databases' showTablesSql = 'show tables' selectSql = 'SELECT * FROM 07_jn_mysql_2' result = ReadHiveTest(selectSql) print(result[1])
위 내용은 Python에서 Hive를 연결하고 시작하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!