问题我用以下方式以CSV 120000行:重新排序重复的联系人。与名单
ID Duplicate
1 65
2 67
4 12
4 53
4 101
12 4
12 53
101 ...
这份名单基本上指定了许多用户ID的,哪些是该用户的重复用户。如何由该列表现在我真的不能在Excel中筛选了这一点,所以我想用这个结果来改造列表:
[1, 65]
[2, 67]
[4, 12, 53, 101]
之后我就可以写入到一个新的CSV只删除列表[ 0],这样我就可以为每个“重复的用户块”保留一个用户。在Excel中,我会删除所有剩余的用户ID。
但是来到这一点,我有几个问题:
import csv
with open("contacts.csv", "rt") as f:
reader = csv.reader(f, delimiter="\t")
contacts = []
for row in reader:
if row[0] not in contacts:
contacts.append(row[0])
if row[1] not in contacts:
position = contacts.index(row[0])
contacts[position].append(row[1])
当然我得到的错误“AttributeError的:‘海峡’对象有没有属性‘追加’”联系人[位置]是一个串。但是,如何更改代码,以便获取每个重复联系人块的列表?
谢谢!
为什么** 101 **在输出中不遵循** 53 **? –
是第一列排序? – Gribouillis
你是对的,编辑它。是的,第一列是排序 – user2252633