下面一个网站的HTML源代码是获取通过DOM ID某些元素从外部网页PhantomJS的例子:如何获得与PhantomJS
var page = require('webpage').create();
console.log('The default user agent is ' + page.settings.userAgent);
page.settings.userAgent = 'SpecialAgent';
page.open('http://www.httpuseragent.org', function(status) {
if (status !== 'success') {
console.log('Unable to access network');
} else {
var ua = page.evaluate(function() {
return document.getElementById('myagent').textContent;
});
console.log(ua);
}
phantom.exit();
});
我希望得到一个网页的整个HTML源代码... 我该怎么做呢?
如果你想HTML源代码,然后使用类似[HTTP模块(http://nodejs.org/docs/v0.5.2/ api/http.html#http.request),而不是通过浏览器运行该页面(这将执行JS并用它对DOM进行修改)。 – Quentin
能告诉我一个例子吗? – MOB