2011-10-11 39 views
-1

可能重复:
Best methods to parse HTML with PHP检索只有一个HTML文件的一部分使用的file_get_contents

我用在PHP中file_get_contents()函数来获取远程网页并运行它变成我的表解析脚本。但基本上,我的表解析脚本只需要页面上的第一个表。

我想下载的页面有3个html表格,所以我想知道是否有一种方法只采取第三个表格?很可能我只想在HTML文件中使用30到60行。有没有人有什么建议?

回答

0

没有文件下载命令会为您解析HTML文件,并确定需要下载的确切块。我不认为有办法下载整个东西,然后用HTML parser来获取表格。

0

你可以将你的主文件分成三个单独的文件(每个表格只有一个文件),它们只是被包含在原文件中。

然后你只需要为你想要的表格做一个file_get_contents

编辑

举个例子,考虑这个文件:

<h1>I am a header</h1> 
<table id = 'table1> 
... 
</table> 

<table id = 'table2'> 
... 
</table> 

<table id = 'table3'> 
... 
</table> 

并将其与该文件进行比较:

<h1>I am a header</h1> 
<?php 
    include 'table1.php'; 
    include 'table2.php'; 
    include 'table3.php'; 
?> 

table1.php将只需持有该表标签之间的一切表1,并且类似地对于table2.phptable3.php

如果你想表3,执行您file_get_contentstable3.php

+0

我不想第2个表虽然 – Shane

+0

如果他们在不同的文件中,你可以得到你想要哪一个。 –

+0

我如何将它们分成不同的文件? – Shane

相关问题