Python新手。Hive Data to Pandas数据框
我如何将数据从配置单元保存到熊猫数据框。
with pyhs2.connect(host, port=20000,authMechanism="PLAIN",user,password,
database) as conn:
with conn.cursor() as cur:
#Show databases
print cur.getDatabases()
#Execute query
cur.execute(query)
#Return column info from query
print cur.getSchema()
#Fetch table results
for i in cur.fetch():
print i
**columnNames = [a['columnName'] for a in cur.getSchema()]
print columnNames
df1=pd.DataFrame(cur.fetch(),columnNames)**
尝试使用列名称。没有工作。
请注意。建议一些事。
'没Work.'很难被认为是一个不错的错误描述:) – cel
我认为是火焰正确的工具 - 但我还没有与它合作过。这可能是一个有趣的阅读你:http://blaze.pydata.org/blog/2015/09/16/reddit-impala/ – cel
谢谢..塞尔指出。无论如何问题现在解决了。 :) –