获取来自网页用的preg_match的具体内容

我想要得到的内容（包括所有的CSS，链接工作等），这是在<div id="some-content"></div>获取来自网页用的preg_match的具体内容

preg_match("/<div id=\'some-content\'>(.*)<\/div>/m", file_get_contents('www.xxx.com'), $output); 
print_r ($output);

但它返回空数组： Array ()

出了什么问题？ preg_match或网页有问题吗？

来源

2012-02-23 Lina

如果你真的想与xxx.com（一个色情网站btw）一起工作，简单的答案是没有一个ID为“some-content”的div，因此你得到一个空数组。在这种情况下，我们鼓励您将URL更改为example.com（这是任何URL示例的官方URL）。尽管如此，答案可能是没有这样的div，或者它不会以这种确切的语法出现。您可以更可靠地使用HTML Parser刮取HTML。请参阅http://stackoverflow.com/questions/3577641/how-to-parse-and-process-html-with-php – Gordon 2012-02-23 13:37:37

没有办法正确计算所有可能的内容，您应该使用HTML解析器，例如。 [PHP的常见问题]（http://stackoverflow.com/questions/3577641/how-to-parse-and-process-html-with-php） – scibuff 2012-02-23 12:50:14

使用DOM解析器。据说无数次的正则表达式不足以解析HTML。

php's built in DOM Parser。 This是一个体面的DOM解析器的PHP。在SO传奇目录上阅读this线程（当然）。

来源

2012-02-23 12:49:37 check123

这并不回答这个问题。如果您只是建议使用DOM解析器，请将其作为注释提供，并将OP指向规范，位于http://stackoverflow.com/questions/3577641/how-to-parse-and-process-html- with-php有 – Gordon 2012-02-23 13:21:24

在旁注中，PHP的PCRE Regex可以很好地处理HTML。这通常不是语言，而是开发人员不能胜任这项工作。所有人链接到的“答案”都是错误的。 – Gordon 2012-02-23 14:13:52

获取来自网页用的preg_match的具体内容

回答

相关问题