2016-05-15 103 views
0

我有一个包含对“艺术家流派” csv文件有问题,如下所示:带分隔符=','的csv文件中的多个逗号?

artist,genre 
Muse,rock 
Nirvana,rock 
Bon Jovi,rock 
The Police,rock 

的问题是CSV分隔符是逗号(“”),但在某些情况下,有多位艺术家用逗号分开,因为在这一行:

John Legend, Travis Scott, Teyana Taylor, Cyhi The Prynce & Malik Yusef,r&b 

当然,这种情况造成了一些麻烦,当我导入我使用来分析它们的软件数据集,所以我在寻找一种编辑文件并解决此问题的方法。

例如可以使用MS Excel来只选择包含多个逗号的行,然后我可以尝试单独处理这些行(它们不应该太多)。

如果您有更好的想法,我希望听到它。谢谢!

回答

1

导入不解析数据,所以它是所有在列A,然后在C1输入:

=MID(A1,FIND(CHAR(1),SUBSTITUTE(A1,",",CHAR(1),LEN(A1)-LEN(SUBSTITUTE(A1,",",""))))+1,255) 

和复制下来并在B1输入:

=MID(A1,1,LEN(A1)-LEN(C1)-1) 

and copy down:

enter image description here

该技巧发现最后一次出现的逗号在一个字符串中,并将其用作分隔符。

+0

非常感谢! –