-1
A
回答
0
是的,我会建议使用XPath
<h1>This is scraping flight radar:</h1>
<?php
$url = "https://www.flightradar24.com/data/flights/southwest-airlines-wn-swa";
$html = file_get_contents($url);
libxml_use_internal_errors(true);
$doc = new \DOMDocument();
if($doc->loadHTML($html))
{
$result = new \DOMDocument();
$result->formatOutput = true;
$table = $result->appendChild($result->createElement("table"));
$thead = $table->appendChild($result->createElement("thead"));
$tbody = $table->appendChild($result->createElement("tbody"));
$xpath = new \DOMXPath($doc);
$newRow = $thead->appendChild($result->createElement("tr"));
foreach($xpath->query("//table[@id='tbl-datatable']/thead/tr/th[position()>1]") as $header)
{
$newRow->appendChild($result->createElement("th", trim($header->nodeValue)));
}
foreach($xpath->query("//table[@id='tbl-datatable']/tbody/tr") as $row)
{
$newRow = $tbody->appendChild($result->createElement("tr"));
foreach($xpath->query("./td[position()>1 and position()<7]", $row) as $cell)
{
$newRow->appendChild($result->createElement("td", trim($cell->nodeValue)));
}
}
echo $result->saveXML($result->documentElement);
}
?>
0
与任何刮努力,请记住,您可能会违反他们的服务条款,特别是如果你重新排版内容。也就是说,https://github.com/FriendsOfPHP/Goutte非常适合这样的任务。
<?php
require 'vendor/autoload.php';
use Goutte\Client;
$data_url = 'https://www.flightradar24.com/data/flights/southwest-airlines-wn-swa';
$client = new Client();
$crawler = $client->request('GET', $data_url);
$crawler->filter('#tbl-datatable')->each(function ($node) {
print $node->html()."\n";
});
+0
数据未被重新发布。这是供个人使用的。另外,我们向网站支付了大量的订阅费用,允许使用各种方法访问数据。 – DARKOCEAN
相关问题
- 1. PHP网页从表中的HTML标签刮
- 2. 从网页从刮HTML
- 3. 从网页刮取HTML? - VB.NET
- 4. PHP网页刮
- 5. rvest从网页的html页面刮
- 6. 从iframe刮去父页html
- 7. 从网页表中刮取值
- 8. 从网页上刮取网页数据
- 9. 从网页上刮 - python
- 10. 从网页上刮信息
- 11. 网页(html)使用C#刮脸
- 12. 刮网页
- 13. 刮网页
- 14. 刮网页
- 15. 用PHP刮掉凌乱的html网站
- 16. 嵌入网页的HTML对象标记
- 17. PHP刮掉一个html页面
- 18. 刮网页包含锚标记<a href = "#"> using scrapy
- 19. 不能刮多个html标签的网页
- 20. 刮坏HTML网站
- 21. Python从网站刮表?
- 22. 如何使用PHP刮取网页?
- 23. 元标记刮板
- 24. 刮标记与BS4
- 25. 从HTML标记中的文件中刮掉文本
- 26. 如何使用Html敏捷包从网页中刮取值
- 27. 刮网页内容
- 28. 刮网页传单
- 29. Java网页刮板
- 30. 如何使用beautifulsoup刮从HTML页面
这真的很好。我将如何撤回位于Flight No和“Live”链接后面的URL? – DARKOCEAN