- 我想从网址获取第一篇文章内容到我的网站。这里是网址,我需要得到:
http://www.vietvbb.vn/up/forumdisplay.php?f=15
从另一个网站获取数据时的简单正则表达式
所以我用萤火虫做。我需要得到这个HTML代码之间的第一篇文章的内容:
<td id="td_post_11229294" class="alt1" style="border-right: 0px solid #262626"><--content that i need--></td>
,我也这样说:
$url = 'http://www.vietvbb.vn/up/showthread.php?t=65690'; $data = file_get_contents($url); preg_match('/<td class="alt1" id="td_post_(.*?)">\r\n(.*?)\r\n<\/td>/s', $data, $tc);echo '<pre>';print_r($tc);echo '</pre>';
但正如你看到的,它不仅返回我真的需要在TD标签,它给我的td标签都先内容后,并使用id = postmenu_xxx div标签,并用类= tborder表标签(这个div和表格,他们是事我不需要):
<div id="postmenu_11229294_menu" class="vbmenu_popup" style="display:none">.....</div> <table class="tborder" cellspacing="0" cellpadding="3" border="0" align="center" width="100%">....</table>
我只希望它返回td标签之间的内容,如上所述。那么,我该怎么做?
你能提供一个页面或不包含铁杆内容色情图片?请记住,这个网站上的人们正在从工作中访问它,我们不希望他们被保护内容过滤器绊倒。 – Kev 2012-07-22 14:41:00
好的,我编辑了我的文章,谢谢Kev:D – 2012-07-23 04:59:07
我添加了“php”标签;如果我猜错了,请删除它并添加正确的语言标签。谢谢。 – tripleee 2012-07-23 07:05:58