我有俄语的字符矢量。请参阅下面的样本载体 -在R中找到字母数字
x = "nНозологические единицы \r\n В20 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], проявляющаяся в виде \r\nинфекционных и паразитарных болезней \r\n В21 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], проявляющаяся в виде \r\nзлокачественных новообразований \r\n В22 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], проявляющаяся в виде \r\nдругих уточненных болезней \r\n В78.1 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], проявляющаяся в виде \r\nдругих состояний \r\n В24 Болезнь, вызванная вирусом иммунодефицита человека [ВИЧ], неуточненная \r\n Z21 Бессимптомный инфекционный статус, вызванный вирусом иммунодефицита человека"
我想提取这些值 - B20,B21,B22,B78.1,B24,Z21。我正在使用下面的代码 -
gsub("[^0-9A-Za-z///' ]", "", x)
但它返回了错误的结果。
[1] "n 20 21 22 781 24 Z21 "
你想要所有的ASCII字符串格式的子字符串吗? –
是的,我希望所有的子字符串格式为ASCII字母数字 – john