2014-09-27 100 views
0

我试图从CDATA获取值在<b></b>之内的值。与simpleXML,但迄今没有任何好的结果。这里是我的xml文件的某一部分 -simpleXML从CDATA获取值

<item> 
<title> 
<![CDATA[ 
Bez starpniekiem tiek izīrēts pilnībā mēbelēts 1-istabu dzīvoklis 5. stāvā uz ilgu laiku. Dzīvoklis mēbelēts, ar iebūvētu vir ... 
]]> 
</title> 
<link> 
http://www.ss.lv/msg/lv/real-estate/flats/riga/centre/abhkp.html 
</link> 
<pubDate>Thu, 25 Sep 2014 02:59:55 +0300</pubDate> 
<description> 
<![CDATA[ 
<a href="http://www.ss.lv/msg/lv/real-estate/flats/riga/centre/abhkp.html"><img align=right border=0 src="http://i.ss.lv/images/2014-09-24/348773/VHkBG09gR1s=/1.t.jpg" width="160" height="120" alt=""></a> 
District: <b><b>centrs</b></b><br/>Street: <b><b>Klijānu 2</b></b><br/>Rooms: <b><b>1</b></b><br/>m2: <b><b>35.00</b></b><br/>Type: <b><b>Renov.</b></b><br/>: <b><b>8.57</b> €</b><br/>Price: <b><b>300</b> €/mēn.</b><br/><br/><b><a href="http://www.ss.lv/msg/lv/real-estate/flats/riga/centre/abhkp.html">Apskatīt sludinājumu</a></b><br/><br/> 
]]> 
</description> 
</item> 

我知道如何从如标题,pudDate,链接此XML文件中获取值,但我不知道我怎样才能从数值说明标签这样我就可以将它们添加到按价格,区域,类型,图像排序的数据库中。

到目前为止,我尝试将描述标签保存到字符串中,之后使用explode()剪出了我需要的信息的部分,我有正确的值,但它们带有标签。一些带有标签。

这就是我试图 -

$url = "http://www.ss.lv/lv/real-estate/flats/riga/hand_over/rss/"; 

$result = simplexml_load_file($url); 

foreach ($result->channel->item as $item) { 
    $title =(string)$item->title; 
    description = (string)$item->description; 
    $link = $item->link; 
    $pubDate = $item->pubDate; 

// Cut out from description price 
    $parts = explode("Price: ", $description); 
    $pri= ""; 
    for ($i = 1; $i < 2; $i++) { 
     $pri= $parts[$i]; 
    } 
    $parts2 = explode("</b>", $pri); 
    for ($i = 1; $i < 2; $i++) { 
     $price= $parts2[0]; 
    } 

,但我认为我的解决方案是absoloutly错误和切割的结果是 - <b><b>300 or <b>650

所以我的问题是:我怎么能得到干净的值了的我的CDATA使用类似的东西

$pubDate = $item->pubDate 

使用类似的东西?

$description = (string)$item->description->b[0] - 从CDATA获得正确的值。

回答

1

在你simplexml_load_file(),你需要添加参数LIBXML_NOCDATA标志:

$url = "http://www.ss.lv/lv/real-estate/flats/riga/hand_over/rss/"; 
$result = simplexml_load_file($url, 'SimpleXMLElement', LIBXML_NOCDATA); 
                 // ^^ here 
foreach($result->channel->item as $item) { 
    $title = (string) $item->title; 
    $desc = (string) $item->description; 
    $dom = new DOMDocument($desc); 
    $dom->loadHTML($desc); 
    $bold_tags = $dom->getElementsByTagName('b'); 
    foreach($bold_tags as $b) { 
     echo $b->nodeValue . '<br/>'; 
    } 
} 
+0

感谢。它的工作原理,但在第一次循环后,我得到了每个下一个值x2。但是,如果我将值保存到数据库中,我可以简单地运行数据库检查,如果数据已经存在,那么如果它们存在,那么不要写它们,对吧? – Santar 2014-09-27 12:16:21

+0

@Santar当然你可以做到这一点,如果有一些重复,但我认为太多的开销,你也可以把它们放在一个数组中,然后在内部循环结束后使用'array_unique ()'这样你就不必每次都去检查数据库了,那更好一点 – Ghost 2014-09-27 12:40:51

+0

我能问你最后一个问题吗?我如何才能从$ b获得价格?当我写回声'$ b-> nodeValue-> item(2)'或'$ b-> item(2) - > nodeValue'时,我不能使用'item(x)',bur – Santar 2014-09-30 23:07:27