0
我正在尝试使用simplehtmldom脚本获取一些文本。该HTML结构如下使用simplehtmldom获取文本片段
<div id="posts">
<div align="center">
<SEVERAL LEVELS OF HTML>
<strong>XXX</strong>
</SEVERAL LEVELS OF HTML>
</div>
<div align="center">
<SEVERAL LEVELS OF HTML>
<strong>IGNORE</strong>
</SEVERAL LEVELS OF HTML>
</div>
<div align="center">
<SEVERAL LEVELS OF HTML>
<strong>IGNORE</strong>
</SEVERAL LEVELS OF HTML>
</div>
</div>
我想要知道的是XXX的字符串,在第一个<strong>
标签第一<div>
内具有属性align="center"
,这是<div>
与id="posts"
内的文本。我对<div align="center">
标签的文字不感兴趣。
的“HTML的几个层次”包括凌乱的嵌套表等
我的代码:我使用的后代选择,显然,我通过HTML的几个层次上“跳跃”。这就是为什么我的print_r
显示"Trying to get property of non-object"
?
$html = file_get_html($page_1);
$es = $html->find('div#posts div[align=center] strong');
print_r($es->plaintext); die;
奇怪的是,该语句也返回相同的"Trying to get property of non-object"
结果。我究竟做错了什么?
$es = $html->find('div#posts');