2014-09-21 129 views
1

我试图通过蟒蛇和机械访问亚马逊卖家中心。刮亚马逊卖家中心

这是我的代码,我认为它正在工作,但是当我检查一个只能访问您的登录页面时,它会被重定向到一个页面: “继续使用亚马逊,请在您的浏览器中激活Cookie ,一旦启用cookies,请点击下面的按钮返回上一页“

如何在我的python或机械化设置中启用cookie?

import mechanize 
import urllib2 
import cookielib 
import requests 

browser = mechanize.Browser() 
browser.set_handle_robots(False) # ignore robots 
browser.set_handle_refresh(False) # can sometimes hang without this 
cj = cookielib.CookieJar() 
browser.set_cookiejar(cj) 

USERNAME = 'MyUsername' 
PASSWORD = 'MyPass' 
response = browser.open("https://sellercentral.amazon.fr/gp/homepage.html") 
browser.select_form("signinWidget") 
browser.form['username'] = USERNAME 
browser.form['password'] = PASSWORD 
responsecheck = browser.submit() 
print responsecheck.read() 


check = browser.open("https://sellercentral.amazon.fr/gp/global-selling/gateway-widget-crosslisting-potential/crosslisting-potential-widget-internals.html?_=1411311676093") 
print check.read()  

谢谢你在前进,

托马斯

+0

可能重复[刮网页,需要他们给你一个会话cookie第一](http://stackoverflow.com/questions/9754807/scrape-a-web-page-that-requires-they-give-你一个会话cookie首先) – user1767754 2014-09-21 19:54:53

+0

我通常只使用requests.Session,但它很好地存储auth cookie。可能要考虑这一点,并根据您真正需要的机械化功能的多少来使用BeautifulSoup作为刮削位。 – BWStearns 2014-09-21 19:58:09

回答

-1

可能是有点晚了,但你有没有尝试设置用户代理? 使用PhantomJS时我有同样的信息。将用户代理更改为 “Mozilla/6.0(Macintosh; Intel Mac OS X 10_9_4)AppleWebKit/537.36(KHTML,如Gecko)Chrome/29.1.1547.57 Safari/537.36”为我解决了它。