2017-07-28 276 views
-2

我有包含'|'的数据,作为分隔符,但每行都有换行符分隔符,这是不相关的。它是这样的:使用Python中的多个分隔符读取csv文件时忽略换行符

- CONTRSTART|"""Contract End Date"""CONTR1END:/BI0/OICONTR1END|"""Contract End Re 
ason"""/BIC/ZUCCANCRS:/BIC/OIZUCCANCRS|"""Disconnection Date"""UC_DIDATE:/BI0/O 
IUC_DIDATE|"""Dunning Procedure"""CADUNN_PRC:/BI0/OICADUNN_PRC|"""Dunning Block 
Reason"""CADUNN_BLO:/BI0/OICADUNN_BLO 
4100006664||00000000|00000000|20130405|20130917|220000081194|20130405|20130903| 
00000000|00000000||00000000|| 
4100012973||00000000|00000000|20130409|20130430|220000145601|20130401|20130401| 

如果您注意到,第一行以'Re'结尾,下一行以'ason'开头。与其他行相同。行也用'/ n'分开,所以我不能忽略所有这些换行符。有没有办法在Python中阅读时忽略这些特定的换行符分隔符?

+0

如果这是你的数据是如何进入,可以考虑重新输入。 –

+0

你将如何让python区分记录之间的分隔符和换行符之间的换行符? –

+0

我没有注意到这个之前你的问题..所以行分离。也是'/ n'分隔的,并且很少有不需要的'/ n'分隔符。有没有办法忽略这些特定的'/ n'分隔符。 – Kautuk

回答

0

我认为你可以使用dropna方法,

#first read your in put 
df=pd.read_csv('file.csv',sep='|') 
#then ignore your new line 
df=df.dropna() 

如果你想要的东西不同添加评论。:)

+0

如上所述读取多列时没有正确分配。 – Kautuk

+0

阅读文件后,您是否获得正确的列顺序? –

+0

不..我已经更新了这个问题,很少有新行分隔符不正确,并放置在行内。 – Kautuk

相关问题