我想以编程方式解析网站的页面,显然我需要完整的HTML代码。但是,站点只能通过直接URL加载一些主页面,一旦加载主页面,它就会通过AJAX接收其内容。如何获取完全加载的HTML页面代码
我怎样才能加载一个页面“像在浏览器”,让它完全加载所有的脚本,他们的工作完成?例如,如果我使用WebBrowser类真正打开一个页面,就像在浏览器中一样,它的DocumentText属性(它应该代表DOM内容)只返回初始页面,而没有通过AJAX加载实际内容或类似的内容google.com)。这也发生在浏览器中,并看到我需要使用开发人员工具的实际HTML。
更新:答案被发现是在这里,这要归功于弗拉基米尔Shmidt how to dynamically generate HTML code using .NET's WebBrowser or mshtml.HTMLDocument?
DocumentText“根” DOM加载后没有更新其内容,但文档属性确实。
是的,它已经,我只是你的评论后,更新了我的问题,请调查一下。 – yaapelsinko 2014-09-18 17:24:10
当WebBrowser中的DocumentCompleted(WebBrowserDocumentCompletedEventHandler)事件足以满足所有站点通过ajax加载的时候? – 2014-09-18 17:27:15
哈姆,我会去看看它...... – yaapelsinko 2014-09-18 17:30:21