我建议你应该使用PHP的DOM Library。它非常强大并且允许解析任何DOM结构。参考它的一些例子,你可以很容易地实现它。
这个想法是,你研究谷歌返回的页面的HTML结构,并相应地使用DOM库来解析特定标签。在每个<li>
标签
<ul class="rg_ul" data-pg="1" data-cnt="6">
<li class="rg_li" data-row="1" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:231px;height:162px"></li>
<li class="rg_li" style="width:218px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:217px;height:162px"></li>
</ul>
有额外的标签,其中之一是<a>
:从我所看到的,图像被组织为<ul>
和<li>
标签,等等。这个标签似乎有两个属性 - “imgrefurl”和“imgurl” - 这可能会给你你需要的图像。您需要的这两个属性中的哪一个是供您探索的。
或者,在<li>
中有一个<img>
标记,它具有包含实际图像二进制文件的“src”属性。所以你也可以解析它。请注意,二进制文件适用于您在搜索页上看到的图像,而不是实际的图像。
对于某些指向DOM的指针,此方法可能有用 - http://www.php.net/manual/en/domelement.getelementsbytagname.php和http://www.php.net/manual/en/domelement.hasattribute.php - 读取所有<li>
标签,然后解析使用类“rg_li”的标签。
希望以上有意义
感谢答复,我试图图像API过,但看起来,我无法实现我的目标在此刻 – 2012-01-14 13:47:12
的就是你得到的图像链接,真正的问题却可以因为无效字符而将它添加到数据库,或者您有关于获取图像url的问题? http://jsfiddle.net/cXwxB/ – ocanal 2012-01-14 13:57:15
我真正的问题是获取图像网址,然后将它们保存到数据库,至少我想要的代码,可以得到一个特定的词搜索图像网址..真的谢谢你帮我 – 2012-01-14 14:08:25