我怎样才能获取所有图像src到file_get_content()
,与preg_match
或其他什么?我如何获取所有图像src到数组与文件获取内容
0
A
回答
4
你不应该使用正则表达式来解析HTML。你应该使用像DOMDocument这样的类来这样做。 DOMDocument有getElementsByTagName方法,可用于从要分析的文档检索所有标记。
下面是将回显图像的列表文件中的例子:
<?php
$document = new DOMDocument();
$document->loadHTML(file_get_contents('yourfilehere.html'));
$lst = $document->getElementsByTagName('img');
for ($i=0; $i<$lst->length; $i++) {
$image = $lst->item($i);
echo $image->attributes->getNamedItem('src')->value, '<br />';
}
?>
0
它更可靠,更易于使用phpQuery或SimpleHTMLparser(更详细)。但对于基本提取目的,只是在寻找SRC =属性,这是矫枉过正和正则表达式其实足够:
preg_match_all('/<img[^>]+src\s*=[\'\"\s]?([^<\'\"]+)/ims', file_get_contents($url), $uu);
注意,它会产生相对路径名,大多没有网址。所以需要后处理,而phpQuery IIRC有一个标准化的快捷方式。
相关问题
- 1. 获取所有图像SRC成数组文件获取内容
- 2. 从DIV内容获取SRC
- 3. 如何使用MATLAB获取文件夹内的所有图像?
- 4. 如何从图像获取SRC jQuery中
- 5. 如何从图像中获取src
- 6. 如何使用simplexml获取图像src
- 7. 如何获取文档中所有内容控件的列表?
- 8. 如何从数组中获取内容
- 9. 与文件PHP错误获取内容
- 10. 申报值与文件获取内容
- 11. 如何获取文件内容的ParcelFileDescriptor?
- 12. 如何获取文件内容
- 13. 文件获取内容PHP
- 14. Spreadsheet_Excel_Writer获取文件内容
- 15. 获取文件内容
- 16. PHP获取文件内容
- 17. 如何从qrc文件中获取所有图像?
- 18. 如何使用C++获取文件夹中的所有图像
- 19. 如何获取与内容相关的所有标签?
- 20. 获取文件内容到json/geojson
- 21. file_get_contents没有获取文件内容?
- 22. 如何从json内容获取图像到android
- 23. 如何获取文件夹内的所有文件?
- 24. Mule ESB:如何获取Amazon S3桶中的文件夹中的所有文件(获取对象内容)
- 25. 从JSON获取图像URL到数组
- 26. 如何获取图像文件?
- 27. C#:获取文件夹中的所有图像文件
- 28. SQL查询不获取所有内容
- 29. 获取所有桶的内容对象
- 30. 使用php获取URL图像内容
正则表达式**不够**,这将解析你可能不想要的东西,如评论中的图像。 – HoLyVieR 2010-08-29 21:15:55
@HoLyVieR,你会有一个真实世界的例子吗? Nobodys谈论解析。 – mario 2010-08-29 21:26:40