2015-02-09 97 views
0

我已经使用php简单的html dom在这个问题上没有成功。 现在我已经去了DOMDocument和DOMXpath,这看起来很有希望。使用DOMXpath提取JSON数据

这是我的问题: 我试图抓取页面最初显示后通过Web服务请求加载的页面的数据。它只有几毫秒,但正因为如此,正常的抓取显示了一个模板值,而不是实际的数据。 我使用Chrome开发人员网络设置找到了端点URL。因此,如果我在浏览器地址栏中输入该网址,则数据将以JSON格式很好地显示。都好。

我的问题出现了,因为任何时候该网站被重新访问或页面刷新后,端点网址的后缀是随机生成的,所以我无法将此网址硬编码到我的PHP文件中。例如,在第一次访问时,url的结尾是“?= 253648592”,但在刷新时可能是“? = 375482910”。网址的基础是静态的。

没有进入无头浏览器(我试过,我的头疼!)有没有办法让Xpath在页面加载时找到这个随机的URL?

对不起,这么长时间啰嗦,但我想尽我所能解释。

回答

0

如果您只需要HTML中的一个项目/值,则使用正则表达式可能会更容易,更快速。我想举一个例子,但为此,我需要一个扩展的片段来说明HTML如何包含您想要获取的端点。

是否可以提供包含端点的HTML片段?