2016-07-28 116 views
-3

我正在尝试使用正则表达式和分组,我无法检索某些信息。我想实现的是,具有下列文字:正则表达式分组选择

<ed><a0><bd><ed><b2><9c><ed><a0><bd><ed><b2><9c><ed><a0><bd><ed><b4><91><ed><a0><bd><ed><b4><91> 

我想正则表达式表达式选择字符组,同时在考虑到赔率<ed>

因此,例如,选择第一组是<ed><a0><bd><ed><b2><9c>和第二组选择将是<ed><a0><bd><ed><b2><9c>

以哪种方式可以实现这一目标?

+0

'在哪一种方式可以实现我这个' - 学习正则表达式。继承人您的回答:'(<.*?9c>)'https://regex101.com/r/oD8oR0/1 –

+0

您的答案将无法正常工作... –

+0

正如拉斐尔所说,这是行不通的。我自己找到了解决方案。 –

回答

0

最后发现这样做的方式。要明确的是一个方法来提取通过在R上的Twitter的API获取Twitter文字表情符号,所以代码会

str_extract_all(i, pattern='<U\\+....>|<ed>.*?<ed>.*?>.*?>') 
2

假设你使用正则表达式的Python实现,这将工作:

re.findall('<ed>.*?<ed>.*?(?=<ed>)', string)