2017-07-15 214 views
3

我试图请求使用请求的网站的HTML,但我不断收到访问被拒绝的错误。我如何克服这个问题?下面是以下功能的代码:NodeJS +请求 - 请求网站时拒绝访问

const request = require('request'); 
function firstShoe() { 
     request('https://www.jdsports.co.uk/product/green-nike-vapormax/281735/', function (error, response, body) { 
      console.log('body:', body); 
     }); 
} 

错误:

</BODY> 
</HTML> 

body: <HTML><HEAD> 
<TITLE>Access Denied</TITLE> 
</HEAD><BODY> 
<H1>Access Denied</H1> 

You don't have permission to access "http&#58;&#47;&#47;www&#46;jdsports&#46;co&#46;uk&#47;product&#47;green&#45;nike&#45;vapormax&#47;281735&#47;" on this server.<P> 
Reference&#32;&#35;18&#46;609d3e17&#46;1500116386&#46;15f0cb85 
</BODY> 
</HTML> 

通过将用户代理到标头中找到的解决方案。

function firstShoe() { 
     var options = { 
      headers: {'user-agent': 'node.js'} 
     } 
     request('https://www.jdsports.co.uk/product/green-nike-vapormax/281735/', options, function (error, response, body) { 
      console.log(body); 
      message.channel.send(body); 
     }); 
    } 
+0

是不是fs.readFile适合这种事情? – yBrodsky

+0

你在哪里运行这段代码?听起来好像可能有防火墙或网页过滤器。 – gregnr

+0

您可能在服务器中存在一些CORS问题。安装该软件包。在你的服务器上安装这个包https://github.com/expressjs/cors。 – user3862830

回答

3

你得到一个403 Forbidden,因为该网站正在阻止使用非普通用户代理发送的所有请求(基本上他们检查User-Agent头)。这是一个非常简单的保护,以避免派生。

例如,如果使用其标准用户代理发送下面的卷曲,该响应被完全接收:

curl -v 'https://www.jdsports.co.uk/product/green-nike-vapormax/281735/' 

然而,如果重复该请求指定非现有用户代理,该请求被封锁:

curl -v 'https://www.jdsports.co.uk/product/green-nike-vapormax/281735/' -H 'User-Agent: StackOverflow'