2016-03-08 49 views
0

我打算写一个工具从soccerway.com中提取数据。事实上,我将创造一种历史。将id添加到解析器html元素?

正如你所看到的数据被分组到足球赛季,所以会有数据库2015/2016, 2016/2017等等。我所做的是获取数据,在数据库中输入数据,然后运行一个cron作业来更新这些值。问题是我应该对他们进行升级或者其他什么事情。我目前只记住解析器的操作,但我不知道如何为每个解析器项目创建一个键。例如,从我提供给你的链接中取得联赛排名,我怎么能(一旦输入数据),在未来,检查与cronjob有更新和替换值? 我知道要查看是否有更新可以利用字段lastUpdate标题并将其保存在数据库的某个位置,那么cronjob会检查每个联盟的该字段。但是,最重要的一点是要识别要更新的值,因为我没有可以参考的id。

有些想法?

回答

0

解析数据时,可以存储即将到来的匹配的日期时间&,并设置脚本运行,然后(不会同时更新)。如果你直接解析HTML代码,它不应该花很长时间。

+0

呃这里的问题是认识到每个项目不只是matc –

+0

哦,在这种情况下,我认为最直接的解决方案是将整个页面代码存储到一个文件中,并每次与在线版本进行比较以检查更新 –