2017-08-07 81 views
0

目前搜刮谷歌搜索结果有点困难吗? 我想找到在谷歌前5个URL一个关键字与python3在Mac上,我的程序如下:谷歌搜索python可能吗?

import requests, bs4 


word =input() 


res = requests.get('https://www.google.co.in/search?q='+str(word)) 


page =bs4. BeautifulSoup(res.text,"lxml") 


result=page.select("a.href") 


... 

有一些失败的教训:

OSError: [Errno 65] No route to host

requests.packages.urllib3.exceptions.NewConnectionError: : Failed to establish a new connection: [Errno 65] No route to host

如何解决这些问题呢?

+3

“可能”?是。但这违反了Google的服务条款,除非您从中获得API密钥并使用它。 –

+1

谷歌已经安装了检测和阻止网页垃圾的系统,但这可能是网络连接错误 – ZuluDeltaNiner

+0

您的Python解释器允许使用您的Internet连接吗?我记得我的Mac向我展示了一个关于OS X阻止来自Python的任何即将到来的连接的警告。尝试转到设置并启用防火墙访问。 – ForceBru

回答

0

刮谷歌搜索网页并非不可能,你只需要研究你的浏览器的行为,并使你的脚本使用这些信息伪装本身作为一个普通的浏览器。这涉及到使用标题,你的GET请求是如何构建的,可能还有一些AJAX函数模仿等等。

requests允许您对完成此操作的请求进行相当好的自定义。

+0

谢谢你的建议 – andy

+0

任何时候)。如果您对如何处理请求有更多具体问题,我可以帮助您 –

+0

您可以给我一个联系方式吗? – andy