2016-09-28 51 views
0

我正在使用我需要清理的庞大Excel文件(14GB),因此只剩下我需要的信息。我将该文件制作成块,以便我的电脑停止崩溃,但现在需要创建一个新的数据库,该数据库仅显示我正在查找的城市的数据。在大熊猫阅读器中创建新的数据库

我已打印(块)

for chunk in reader: 
    print(chunk) 

我不确定如何继续,我想

df = reader 
df = reader[reader.SitusCity == Miami] 

但得到这个错误代码:

--------------------------------------------------------------------------- 
AttributeError       Traceback (most recent call last) 
<ipython-input-7-d4c11720d1c5> in <module>() 
----> 1 df = reader[reader.SitusCity == Miami] 

AttributeError: 'TextFileReader' object has no attribute 'SitusCity' 

帮助! !

+0

不知道为什么你从字面上了一切片断,但这是HTML和JS,而不是Python和错误堆栈 –

回答

0

试试这个:

chunk in reader: 
    chunk.ix[chunk.SitusCity == 'Miami'].to_excel('output.xlsx', mode='a')