我正在寻找从数据集中提取一系列3字母代码。 每个条目都有一组3个不是“CCV”的大写字母,但它们的 在每个条目中的位置有所不同。标识大写字母三联体
目前我正尝试: (?!CCV)[A-Z]{3}
我有条目类似的数据集:
CCV_21123214_AAA CCV_02390394_AAC 094804958_AAA_ee9r80 BLAH_CCV_odfdkk_BBB
和希望:
AAA AAC AAA BBB
问题是我目前的做法一直在抓住其他首都的信件编辑的话不是像“BLAH”,3个字母长得到其中的一部分作为像三胞胎:
AAA BLA LAH AAC
有没有办法找到唯一的大写字母三胞胎?
您使用哪种语言或工具? –
我主要在R工作。 – Furmole
在两端使用一对负向变量'(?<![AZ])(?!CCV)[AZ] {3}(?![AZ])' – revo