我想每隔一小时刮一个网站,让我们说CNN,并将H1中的任何标题添加到我的MYSQL表的新行中。我怎么做?使用PHP Curl,我想将H1刮入数据库
-2
A
回答
3
我不指望任何人为你完成整个工作,但这里有一些让你开始的东西。首先,你需要得到实际的来源,你可以使用file_get_contents或curl这个。有很多关于如何在这里的信息。
然后,你需要刮所有H1标签的CNN。一个简单的方法是使用DOMDocument。下面是一个简单的函数来从HTML源得到所有的标题:
function get_h1($html) {
$dom = new DOMDocument();
@$dom->loadHTML($html); // Supress warnings if our html is not well formed
$headings = $dom->getElementsByTagName("h1");
$retval = array();
foreach($headings as $header) {
$retval[] = $header->nodeValue;
}
return $retval;
}
注意,这不能解释不同的编码等
解析另一种选择是使用优秀PHP Simple HTML DOM Parser。
然后您需要将它保存到您的数据库,您可以使用mysqli或PDO库。
最后,你需要每小时运行一次。使用cron-jobs来做到这一点。您可以找到有关如何设置您的cron作业的信息here。
这应该有助于开始。您可能希望为此添加更多功能,例如确保您不添加重复的标题等。
0
您知道,这让我好奇。我只是在玩NodeJS。我敢打赌,服务器端的JQuery和AJAX真的可以在一瞬间敲掉这样的东西。不知道关于连接到数据库,但解析将是一个蛋糕散步。
相关问题
- 1. 使用CURL将特定数据输入到数据库中
- 2. 使用php刮擦数据
- 3. 使用PHP curl刮去aspx页面
- 4. 使用curl刮取iframe内容php
- 5. 刮板插入数据库
- 6. 不想将值写入数据库
- 7. 如何使用cURL从网站获取特定数据,然后将其保存我的数据库使用php
- 8. 使用PHP将数组数据值插入MySQL数据库表
- 9. 我想使用codeigniter框架php从mysql数据库中读取?
- 10. 使用PHP从网站刮取数据
- 11. 使用.php将数据写入数据库
- 12. 无法使用php将数据输入到数据库中
- 13. 无法使用php脚本将数据插入数据库
- 14. 我想使用LINQ在数据库中插入新行的sql
- 15. 我想从用户数据,并插入到数据库(SQL)
- 16. 我想用spring和hibernate插入数据到数据库中
- 17. 我想用PHP访问MySQL数据库,所以用户可以输入到我的数据库
- 18. 输入数据,并使用刮硒
- 19. PHP刮刀写入到MySQL数据库错误
- 20. 初学PHP:我无法将数据插入MYSQL数据库
- 21. 我想decript SQL数据库
- 22. 使用Java(HTMLUnit)刮网页,然后将结果写入mySQL数据库
- 23. 使用curl在php中检索数据
- 24. PHP:使用cURL发送XML数据PUT
- 25. PHP https使用cURL发布XML数据
- 26. 我想送点 “HTTP 200” 使用curl
- 27. facebook-php-sdk不想在我的数据库中存储数据
- 28. 使用PHP将多维数组插入到数据库中
- 29. 使用PHP将数组插入数据库
- 30. 使用PHP将数组元素插入数据库的语法
我会为你做200美元。 – 2011-01-09 09:20:59
你的问题是什么?你有什么尝试? – alexn 2011-01-09 09:28:30
您可能希望挖掘Google,学习一下,当您对特定问题有特定疑问时再回来。你可以先搜索Google“php curl tutorial”,然后“用php解析html”,最后选择“php mysql tutorial”。把这些技巧结合起来解决所有的问题,除* hourly *位外,这可能最适合[Cron](http://en.wikipedia.org/wiki/Cron)。 – Kevin 2011-01-09 09:34:12