2017-10-11 75 views
-2
  00   01   02   03   04 
    1 (value00) (value01) (value02) (value03) (value04) 
    .  . 
    .  . 
    .  . 
    1003 (value00) (value01) (value02) (value03) (value04) 

我有一个文本文件,它有5列,如上例所示。我需要使用称为Pandas的Python库将数据附加到此文本文件。这个文件最后需要的行数大约是1003.对不起,如果你不明白我的解释,我是Pandas的新手。Python - 使用熊猫在现有表中追加数据

例如:

  00   01   02   03   04 
1  4053  4665  1003  5823  5646 
2  5656  5525  4561  4654  4568 
3  4656  4652  4785  4987  2354 
4  3262  2335  2154  5654  4658 
5  5674  6584  4562  4568  5486 
[...] [...]  [...]  [...]  [...]  [...] 
1003  3543  1351  3215  4532  1315 

我该怎么办呢?

+0

请提供[MCVE。 – IanS

+0

@IanS我有一个文本文件,它有5列,如上例所示。我需要使用称为Pandas的Python库将数据附加到此文本文件。这个文件最后需要的行数大约是1003.对不起,如果你不明白我的解释,我是Pandas的新手。 – b3g1nn3er

回答

1

我使用df.loc [行],其内部循环很容易地使用做到这一点。

import pandas as pd 

df = pd.DataFrame(columns=[str(i).zfill(2) for i in range(5)]) 
df.loc[0] = range(5) # add row 
df.loc[1] = range(5) # add row 

for i in range(len(df),len(df)+2): 
    df.loc[i] = range(5) # add rows to end by starting at len(df) 

df 

返回

00 01 02 03 04 
0 0.0 1.0 2.0 3.0 4.0 
1 0.0 1.0 2.0 3.0 4.0 
2 0.0 1.0 2.0 3.0 4.0 
3 0.0 1.0 2.0 3.0 4.0 
0

将数据添加到数据框中的列。这将工作。我认为你正在寻找更具编程意义的东西。请注意,我们所有的数据将需要相同的大小,所以像这样追加是乏味的,但它会起作用。

import pandas as pd 
df = pd.DataFrame({'00': ['value1', 'value2', 'value3'], 
       '01': ['value4', 'value5', 'value6'], 
       '02': ['value7', 'value8', 'value9'], 
       '03': ['value10', 'value11', 'value12'], 
       '04': ['value13', 'value14', 'value15']}) 

In[2]: df 

Out[2]: 
    00  01  02  03  04 
0 value1 value4 value7 value10 value13 
1 value2 value5 value8 value11 value14 
2 value3 value6 value9 value12 value15 

如果他们是不一样的形状,你可能会看到这个错误ValueError: arrays must all be same length