2015-04-01 86 views
3

我想从html标记字符串名称只提取。 我想获得这样的结果:正则表达式来转义HTML标记

  • 农场1
  • STAGING
  • STAGING_SYSTEM_10

我可以使用什么类型的正则表达式?

<div class='singleNode'><i class='fa fa-cogs'></i><span>Farm 1<span class='badge badge-primary'></span><span></div> 

<div class='singleNode'><i class='fa fa-cubes'></i><span>STAGING<span class='badge badge-primary'></span><span></div> 

<div class='singleNode'><i class='fa fa-desktop'></i><span>STAGING_SYSTEM_10<span class='badge badge-primary'></span><span></div> 
+3

使用HTML解析器而不是正则表达式。与HTML正则表达式的影响可以[不幸](http://stackoverflow.com/a/1732454/67392)。 – Richard 2015-04-01 08:29:49

回答

5

如果你必须使用正则表达式,这里是示例代码:

var re = /<div[^>]*?>(?:<(\S+)[^>]*?>[^<]*?<\/\1>)+<span[^]*?>([^<]*?)(?=<span)/g; 
 
var str = '<div class=\'singleNode\'><i class=\'fa fa-cogs\'></i><span>Farm 1<span class=\'badge badge-primary\'></span><span></div>\n\n <div class=\'singleNode\'><i class=\'fa fa-cubes\'></i><span>STAGING<span class=\'badge badge-primary\'></span><span></div>\n\n<div class=\'singleNode\'><i class=\'fa fa-desktop\'></i><span>STAGING_SYSTEM_10<span class=\'badge badge-primary\'></span><span></div>'; 
 
var m; 
 
    
 
while ((m = re.exec(str)) !== null) { 
 
    if (m.index === re.lastIndex) { 
 
     re.lastIndex++; 
 
    } 
 
    // View your result using the m-variable. 
 
    // m[2] is the 2nd capture group, the text inside the DIV element 
 
    alert(m[2]) 
 
}

如果你可以用DOM解析它,使用此代码:

var input = document.getElementsByTagName("div"); 
 
for ($i = 0; $i < input.length; $i++) 
 
{ 
 
    alert(input[$i].textContent); 
 
}
<body> 
 
<div class='singleNode'><i class='fa fa-cogs'></i><span>Farm 1<span class='badge badge-primary'></span><span></div> 
 

 
<div class='singleNode'><i class='fa fa-cubes'></i><span>STAGING<span class='badge badge-primary'></span><span></div> 
 

 
<div class='singleNode'><i class='fa fa-desktop'></i><span>STAGING_SYSTEM_10<span class='badge badge-primary'></span><span></div> 
 
    </body>

+0

这个问题说HTML是在一个字符串中。在你这样做之前,你需要把它变成一个DOM。 – Quentin 2015-04-01 08:55:48

+0

@Quentin:我也加了一个正则表达式解决方案。 – 2015-04-01 09:11:35

+0

谢谢! (λ= user3790694 2015-04-01 11:52:10