注:我无法提供任何代码,因为我还没有开始此项目的工作。我不是在寻找能够为我工作的代码。我想要建议和方向。访问Google搜索结果
我想知道通过python访问Google搜索结果的最佳方式。
例如:当你输入查询Premier League Table
到谷歌搜索将返回一个不错的表的所有信息:
我只需要在表中的信息。我搜索了答案,并碰到:
- 谷歌应用程序引擎 - 不要以为我需要这个,因为它看起来更像是一个平台来托管你的应用程序,一旦它完成。
- 自定义搜索API(Google) - 其付费。我需要免费的东西。
- pygoogle - 它的死者
- duckduckgo API - Duckduckgo search不会将表格作为第一个结果。
- 硒 - 不是我在找的东西
- urllib/BeautifulSoup - 页面源不是HTML(我认为它的AJAX,不确定)。
任何建议都非常有帮助
为什么不从初级资源访问它,如[这一个](http://www.premierleague.com/en-gb/matchday 20支球队名单/league-table.html)? Afaik谷歌只会从最好的结果中汇总这些数据。至于访问搜索结果,我现在知道的最好的解决方案是[this](https://github.com/NikolaiT/GoogleScraper) – pad 2014-11-23 20:54:08
我想要遍历更多这样的表格(团队排名)。它只是我喜欢简单的谷歌布局。官方网站在他们的页面上有很多“额外”的东西,我发现这些东西是不必要的,更不用说有不同的布局,它们需要不同的代码。 – Beginner 2014-11-23 20:59:16