2012-02-14 39 views
-2

可能重复提取HTML body标签内容时:
How to parse and process HTML with PHP?
How to parse HTML with PHP?忽略类属性与正则表达式

我想获得什么是使用正则表达式一个body标签内,但在某些情况下它不起作用。

例如,如果一个网页有:

<body>text</body> 

它会工作,但如果身体标记有一个类或定义的东西,它不会工作,像

<body class="something">text</body> 

我需要正则表达式在这两种情况下工作。

+0

'变化[以<并且]具有> .'完成。 – 2012-02-14 18:49:10

+0

你目前使用什么正则表达式? – 2012-02-14 18:52:59

+1

['xpath_match_all('// body',$ html);'](https://gist.github.com/1358174) – Gordon 2012-02-14 19:03:01

回答

2

使用[^>]*>后 '体' 字:

<body[^>]*>.*</body> 
+1

您在\之前忘了\符号。 '] *>。* <\/body>'。谢谢。 – 2012-02-14 19:01:20

+0

@Zeus:如果这回答了你的问题,请将其标记为(这有助于保持网站“干净”)。 – 2012-02-15 09:13:45