2017-06-13 370 views
14

我有一个动态的DataFrame,它工作正常,但是当没有数据要添加到DataFrame时,我得到一个错误。因此我需要一个解决方案来创建一个只有列名的空DataFrame。熊猫创建只有列名的空DataFrame

现在我有这样的事情:

df = pd.DataFrame(columns=COLUMN_NAMES) # Note that there are now row data inserted. 

PS:该列名仍出现在一个数据帧是很重要的。

但是当我使用它像这样我得到类似的东西,结果:

Index([], dtype='object') 
Empty DataFrame 

“空数据帧”的部分是好的!但是,我需要仍然显示列,而不是索引的东西。

编辑:

,我发现了一个重要的事情:我这个数据帧转换为使用Jinja2的一个PDF,所以因此我呼唤第一输出的方法为HTML这样的:

df.to_html() 

这是我认为列丢失的地方。

编辑2: 一般来说,我遵循这个例子:http://pbpython.com/pdf-reports.html。 CSS也来自链接。 这就是我做的数据帧发送到PDF:

env = Environment(loader=FileSystemLoader('.')) 
template = env.get_template("pdf_report_template.html") 
template_vars = {"my_dataframe": df.to_html()} 

html_out = template.render(template_vars) 
HTML(string=html_out).write_pdf("my_pdf.pdf", stylesheets=["pdf_report_style.css"]) 

EDIT3:

如果我打印出来的数据帧创建后我得到的跟随着:

[0 rows x 9 columns] 
Empty DataFrame 
Columns: [column_a, column_b, column_c, column_d, 
column_e, column_f, column_g, 
column_h, column_i] 
Index: [] 

这似乎是合理的,但如果我打印出template_vars:

'my_dataframe': '<table border="1" class="dataframe">\n <tbody>\n <tr>\n  <td>Index([], dtype=\'object\')</td>\n  <td>Empty DataFrame</td>\n </tr>\n </tbody>\n</table>' 

而且看起来列已经丢失了。

E4: 如果我打印出以下:

print(df.to_html()) 

我得到以下结果已:

<table border="1" class="dataframe"> 
    <tbody> 
    <tr> 
     <td>Index([], dtype='object')</td> 
     <td>Empty DataFrame</td> 
    </tr> 
    </tbody> 
</table> 
+0

是否低于现在为你工作? 如果不是,你应该提供更多关于你的环境的信息,比如Python版本,Pandas版本等。 –

+0

我正在使用Python v3.4,Pandas v0.13.1 –

+1

嗨Eerik,我无法重现你在E4中拥有的东西。如果我这样做,打印出来就像我下面的内容。你能更新你的熊猫版吗?因为你的比较老(我在0.20.1)。 –

回答

27

你是什么意思,你得到这个“作为结果”。您可以创建任意列名或索引空数据框:

In [4]: import pandas as pd 
In [5]: df = pd.DataFrame(columns=['A','B','C','D','E','F','G']) 
In [6]: df 
Out[6]: 
Empty DataFrame 
Columns: [A, B, C, D, E, F, G] 
Index: [] 

或者

In [7]: df = pd.DataFrame(index=range(1,10)) 
In [8]: df 
Out[8]: 
Empty DataFrame 
Columns: [] 
Index: [1, 2, 3, 4, 5, 6, 7, 8, 9] 

编辑: 即使有.to_html你的修订后,我无法重现。这:

df = pd.DataFrame(columns=['A','B','C','D','E','F','G']) 
df.to_html('test.html') 

产地:

<table border="1" class="dataframe"> 
    <thead> 
    <tr style="text-align: right;"> 
     <th></th> 
     <th>A</th> 
     <th>B</th> 
     <th>C</th> 
     <th>D</th> 
     <th>E</th> 
     <th>F</th> 
     <th>G</th> 
    </tr> 
    </thead> 
    <tbody> 
    </tbody> 
</table> 
+0

我编辑了主要问题,如果有帮助。 E:再次编辑。 –

0

您正在寻找这样的事情?

COLUMN_NAMES=['A','B','C','D','E','F','G'] 
    df = pd.DataFrame(columns=COLUMN_NAMES) 
    df.columns 

    Index(['A', 'B', 'C', 'D', 'E', 'F', 'G'], dtype='object') 
+0

这就是我已经有,请参阅我编辑的问题 –

+0

https://stackoverflow.com/questions/33155776/best-way-to-export-pandas-df-into-a-pdf-file-using-python – Linda

+0

也当我尝试时,我不会失去我的专栏名称。它是一个html表格格式。 – Linda