如何将这样的列分隔开,其中数据具有分隔符但其余部分不是并且它具有一些不相等的字符串?用不均匀/不等分的字符串和无分隔符分隔列
输入: ID
142 TM500A2013PISA8/22/17BG
143 TM500CAGE2012QUDO8 /一千七百二十○分之二十二+
输出:
类网站菜地一年种日期部分 142 TM 500 A 2013 PISA 8/22/17 BG 143 TM 500 CAGE 2012 QUDO 17年8月22日20+
我捅了周围的其他问题,并尝试的东西,如果它是一个平等的字符串即可以工作:
>df <- avgmass %>% separate(id, c("site", "garden", "plot", "year",
"species", "sampledate", "portion"),sep=cumsum(c(2,3,3,4,4,5)))
但随着情节的ID是A ,B或CAGE;日期有“/” - 我不知道如何处理它。
由于我对R相对比较陌生,我试图寻找更多关于如何使用sep参数的细节,但无济于事......感谢您的帮助。
如果是固定长度的不,尝试用'?extract' – akrun
你能显示预期的输出 – akrun
我们不知道这些字母和数字的意思。分割领域的规则是什么?为什么世界上的数据是这样格式化的? – MrFlick