为了帮助我学习Python,我决定从ESPNFC网站的'live'页面(例如here)上截屏。使用Python/Scrapy/Urllib2进行屏幕截图似乎被屏蔽
它一直在努力,直到一天前,但最终排序了一些东西,我去测试它,我回来的唯一一条评论是[u'Commentary Not Available']。
有没有人有任何想法他们如何做到这一点,以及任何简单快捷的方法?我正在使用Scrapy/Xpath和Urllib2。
编辑//
for game_id in processQueue:
data_text = getInformation(game_id)
clean_events_dict = getEvents(data_text)
break
不起作用一样
i = getInformation(369186)
j = getEvents(i)
在第一个样品,processQueue是在game_ids名单。是考虑到这些第一个脚本开始刮擦。这是在它有机会移动到另一个游戏之前打破的game_id
在第二个示例中,我使用单个游戏ID。
第一个失败,第二个失败,我完全不知道为什么。有任何想法吗?
确定的值传递给第一个样品的第一次迭代是一样的价值观第二样品中通过?检查类型也是一样的,并且你没有混淆整数/字符串。 – halfer
我喜出望外,你是对的。我不能相信我是这么一个白痴,不去检查我正试图去的网址。这不是一个字符串,它实际上是在url中的中间一个巨大的列表。谢谢你的帮助。 – user2073606
嘿,伟大的东西'':-)。 – halfer