我有一个包含9列的文件。其中一列包含这样的字符串将多分隔符列拆分为多列
Unique
3:107912234-107912321(-)
4:107913333-107913322(+)
Y:222002110-221002100(+)
MT:34330044-343123232(-)
X:838377373-834121212(+)
〜400,000行不同的字符串。我怎样才能将它分成4个不同的列,如果只有一个分隔符,我可以使用df.str(",")
,但由于它有不同的分隔符,我迷路了。
预期输出:
chr start end strand
3 107912234 107912321 -
4 107913333 107913322 +
Y 222002110 221002100 +
MT 34330044 343123232 -
X 838377373 834121212 +
@StevenRumbalski - 谢谢你,我是你的建议添加到代码。 – jezrael
这是一如既往的伟大!我没有意识到[ - +]的用法,我可能只是使用(。*?)它是否也适用于其他字符? – Vaishali
@ A-Za-z - 谢谢,我添加你的建议来回答。 – jezrael