0
时候当我试图抓取此网页:使用遇到trustAsHtmlFilter爬行
scrapy shell url
然后做一个
view(response)
我看到页面上显示trustAsHtmlFilter。页面布局在那里,但是没有显示所有的内容。所以我猜这个网站使用这个过滤器来阻止我的抓取工具。
我做过谷歌它,它似乎像这个过滤器来自AngularJS?不知道这一点
所以我的问题是:
什么可能是触发此过滤器的原因是什么?我几天前爬过这个页面,当时很好。
有没有办法解决这个问题?
谢谢!
您是否尝试过在请求中使用'user agent'? 'scrapy shell -s USER_AGENT ='user agent''http:// www.example.com'' – Rahul
我用过它,仍然被该过滤器阻止 – user2628641