可能重复:
Best methods to parse HTML with PHP检索只有一个HTML文件的一部分使用的file_get_contents
我用在PHP中file_get_contents()
函数来获取远程网页并运行它变成我的表解析脚本。但基本上,我的表解析脚本只需要页面上的第一个表。
我想下载的页面有3个html表格,所以我想知道是否有一种方法只采取第三个表格?很可能我只想在HTML文件中使用30到60行。有没有人有什么建议?
可能重复:
Best methods to parse HTML with PHP检索只有一个HTML文件的一部分使用的file_get_contents
我用在PHP中file_get_contents()
函数来获取远程网页并运行它变成我的表解析脚本。但基本上,我的表解析脚本只需要页面上的第一个表。
我想下载的页面有3个html表格,所以我想知道是否有一种方法只采取第三个表格?很可能我只想在HTML文件中使用30到60行。有没有人有什么建议?
没有文件下载命令会为您解析HTML文件,并确定需要下载的确切块。我不认为有办法下载整个东西,然后用HTML parser来获取表格。
你可以将你的主文件分成三个单独的文件(每个表格只有一个文件),它们只是被包含在原文件中。
然后你只需要为你想要的表格做一个file_get_contents
。
编辑
举个例子,考虑这个文件:
<h1>I am a header</h1>
<table id = 'table1>
...
</table>
<table id = 'table2'>
...
</table>
<table id = 'table3'>
...
</table>
并将其与该文件进行比较:
<h1>I am a header</h1>
<?php
include 'table1.php';
include 'table2.php';
include 'table3.php';
?>
table1.php
将只需持有该表标签之间的一切表1,并且类似地对于table2.php
和table3.php
。
如果你想表3,执行您file_get_contents
上table3.php
我不想第2个表虽然 – Shane
如果他们在不同的文件中,你可以得到你想要哪一个。 –
我如何将它们分成不同的文件? – Shane