我试图编辑一个包含4百万行数据的19列CSV文件。有两列(第三和第四)列出了个人的姓名,他们的名字列出的方式是“姓氏,名字”。使用Python 3.5从CSV文件中的仅两列删除特定字符
C00431445,"P80003338","Obama, Barack","DUCLOS, DUNCAN","CHICAGO","IL","606601303","OBAMA FOR AMERICA","ACCOUNTING MANAGER",77.65,08-AUG-08,"","","","SA17A","753821","5433431","P2008",
这是问题,因为当我尝试使用逗号分隔符文件上传到MySQL,它在半分割这2列的名字。我想使用Python 3.5来选择这两列,并且只从其中删除逗号,而不删除其他行中的逗号。
当谈到编码和任何帮助时,我都是新手。我知道可以使用.split()拆分这些列,然后将它们合并为无逗号,但是我想要一个更清晰的方法,它将直接从该文件中删除逗号。
这看起来有效CSV ,你用什么工具将数据加载到MySQL中? – hruske
不完全确定“什么工具”的含义,我使用SQL查询来创建,修改我的表以添加一个自动递增主键,然后查询它只是为了发现我的数据沿着名称分裂,因为名字和姓氏用逗号分隔。我会附上我的查询,但评论部分没有足够的空间,显然。 – dataelephant