我试图获取https://www.google.com/webmasters/tools/index-status?hl=en&authuser=0&siteUrl=xxx
的源代码以获取由于某种原因未通过webmasters v3
API公开的索引状态编号。Ruby HTTP再次调用需要活动会话的站点
现在我不能只是做一个HTTParty.get(url)
电话,因为这只会给我一个重定向到帐户登录页面(https://accounts.google.com/ServiceLogin?xxxxxx
)。如果我运行HTTParty.get(url, {follow_redirects: false})
,则会出现302错误,因为该页面无法将我重定向到Google的登录页面。
基本上问题是:是否有可能采取我现有的登录cookie并提供给脚本或让脚本“登录”然后存储会话cookie?
后半部分将主要包括:
- 获取来电
https://accounts.google.com
- POST提交登录表单
- 等待响应,保存Cookie
- 使用该会话去上面搜索控制台URL
请阅读“[问]”和链接的页面。如果您遇到代码问题,请阅读“[mcve]”。我们需要更好地描述问题。我们需要更好地理解你是如何做到这一点的。你看过使用[Mechanize](https://github.com/sparklemotion/mechanize)吗?它旨在帮助浏览网站并为您处理饼干。 –
谢谢。随着机械化我能够得到我的谷歌会话,并刮去我需要的网站。 – Killerpixler