0
我打算写一个工具从soccerway.com中提取数据。事实上,我将创造一种历史。将id添加到解析器html元素?
正如你所看到的数据被分组到足球赛季,所以会有数据库2015/2016, 2016/2017
等等。我所做的是获取数据,在数据库中输入数据,然后运行一个cron作业来更新这些值。问题是我应该对他们进行升级或者其他什么事情。我目前只记住解析器的操作,但我不知道如何为每个解析器项目创建一个键。例如,从我提供给你的链接中取得联赛排名,我怎么能(一旦输入数据),在未来,检查与cronjob有更新和替换值? 我知道要查看是否有更新可以利用字段lastUpdate标题并将其保存在数据库的某个位置,那么cronjob会检查每个联盟的该字段。但是,最重要的一点是要识别要更新的值,因为我没有可以参考的id。
有些想法?
呃这里的问题是认识到每个项目不只是matc –
哦,在这种情况下,我认为最直接的解决方案是将整个页面代码存储到一个文件中,并每次与在线版本进行比较以检查更新 –