2009-10-05 73 views
2

我想使用简单的HTML DOM来提取标签内的类与“sitepoint”的一切。这里是我的代码无法正常工作:卡住简单的Html Dom和提取信息

<?php 
include_once('simple_html_dom.php'); 

$html = file_get_html('examplewebsite'); 
$ret = $html->find('.sitepoint'); 
echo $ret; 

?> 

下面是sitepoint标签之一的例子(有十个左右)里面,我想要的信息。

<dl class="sitepoint"> 
<dd class="thumbnail"> 
<a href="blabla" ></a><a href="/toolbar/sidepanel.php?url=random.html" >Get This  Now</a> </dd><dt class="notext"><a href="/to/" >Title</a></dt><dd class="starts"> 
<table width="100%" cellpadding="0" cellspacing="0" border="0"> 
<tr><td class="textUncolor"> CUT OUT SOME IMAGES AND  ADDRESSES HERE 
          </td></tr> 
</table> 
</dd> 

谁能帮我得到它的工作?

+0

+1不尝试使用正则表达式。 ;) – TrueWill 2009-10-05 21:42:10

回答

0

您需要访问outertext属性。

$html->find('.sitepoint',0)->outertext; 

查看docs了解更多信息。看在“魔法属性”

编辑

在选择类,你需要指定哪一个您使用在文档中。我改变了上面的例子来反映这一点。这是测试和工作。 (注意0作为第二个参数查找)

+0

你好,我改行 $ html-> find('。sitepoint') - > outertext; 它没有工作。 – 2009-10-05 21:38:20

+0

html关闭

标记吗? – 2009-10-05 21:42:48

+0

啊我一定已经把标签拿出来了,它在html中关闭了。 Btw在文档中有几个

标签。 如果有人能告诉我我在哪里出错,我将不胜感激。 – 2009-10-05 22:26:19