我有一个csv文件,其中第一列包含标识符和第二列关联数据。标识符被复制任意次数,所以文件看起来像这样。
data1,123
data1,345
data1,432
data2,654
data2,431
data3,947
data3,673在python或numpy中合并记录
我想合并的记录产生单记录每个标识符并获取。
data1,123,345,432
data2,654,431
data3,947,673
是否有一个有效的方式Python或numpy的做到这一点?字典由于重复的键而显示出来。目前,我在列表中列出了行,然后循环并测试列表中索引为0的前一个值的身份,但这非常笨拙。谢谢你的帮助。
“字典似乎是出因重复键”我不知道我明白为什么这是一个问题。具有值列表的字典是否不起作用?就像在你的例子中一样,用'{'data1':[123,345,432],'data2':[654,431],'data3':[947,673] }' – 2012-01-27 00:48:25