2017-02-25 82 views
2

我有一个熊猫的数据帧,看起来像这样:将多个列合并到一列在同一个数据帧熊猫

Time (min) 20m Wind Speed (m/s) Wind Dir (deg)  40m Wind Speed (m/s)  Wind Dir (deg).1 60m Wind Speed (m/s) 60m Wind Dir (deg) 
     1.0   1.5      120.4      2.5    133.2     3.5     190.5    

我想所有的风向列合并成一个单一的风向(度)列以及所有的风速列到一个单一的风速(m/s)栏,使数据帧将如下所示:

Time (min)  Wind Speed (m/s)   Wind Dir (deg)                                       
     1.0     1.5     120.4      
     NAN     2.5     133.2 
     NAN     3.5     190.5 

我看着合并,连接,并连接但这些似乎是将不同的数据帧组合在一起。我认为,也许pd.melt或append可能工作,但我不认为我正在使用我的例子正确实施它。有人能指引我朝着正确的方向吗?谢谢!

回答

0

所以我只是复制并粘贴你的第一个代码块并将其保存为test.ssv。你与pd.melt在正确的轨道上。

# Python 2.7.12 and pandas 0.19.2 
import pandas as pd 

df = pd.read_csv('~/Desktop/test.ssv', sep='\s\s+') 

wind_speed_df = pd.melt(
    df, value_vars=['20m Wind Speed (m/s)', '40m Wind Speed (m/s)', '60m Wind Speed (m/s)']) 
wind_dir_df = pd.melt(
    df, value_vars=['Wind Dir (deg)', 'Wind Dir (deg).1', '60m Wind Dir (deg)']) 
wind_speed_df.reset_index(inplace=True, drop=True) 
wind_dir_df.reset_index(inplace=True, drop=True) 
wind_dir_df = wind_dir_df.rename(columns={'value': 'Wind Speed (m/s)'}) 
wind_speed_df = wind_speed_df.rename(columns={'value': 'Wind Dir (deg)'}) 
new_df = wind_speed_df.merge(wind_dir_df, right_index=True, left_index=True) 
new_df.drop(['variable_x', 'variable_y'], inplace=True, axis=1) 
new_df['Time (min)'] = df['Time (min)'].repeat(3).reset_index(drop=True) 

print new_df.head() 
+0

这一切似乎工作,除了最后一次呼吁在时间('分钟')列加回来。它给了我一个ValueError:不能从重复轴重新索引。我也想知道是否有办法轻松做同样的事情,但使用索引的情况下列名可能会改变 – user1332577

+0

是的索引是[0,0,0]因为重复,必须添加在一个。下降。 – wordsforthewise

+0

我想你可以做一个函数,并使用.apply(lambda x:func(x)) – wordsforthewise