2010-09-10 98 views
8

我有一个很好的黑客Perl脚本来自动从iTunes Connect中下载和下载销售报告文件。截至今日,苹果公司彻底改变了销售报告网站。它看起来好多了,但它使用了大量的JavaScript,简单的抓取不会再起作用。自动从iTunes Connect下载销售报告

那么,有没有人知道一种方法来有效地刮这个新网站?

部分previousquestions指向各种脚本和在线服务。我想现在他们全部都坏了。如果你知道某个功能仍然有效,请告诉我。

回答

7
+0

这工作完美。非常好的工作。谢谢! – 2010-09-14 13:22:31

+0

要清楚,这不是我的工作。它是http://stackoverflow.com/users/245020/kirby-t – Hafthor 2010-09-14 17:03:35

+0

苹果是否有可能在过去的24小时内再次改变事情?我刚刚尝试了脚本v2.0.1并且它不工作(第245行的错误:列表索引超出范围) – Brian 2010-09-15 14:40:20

1

尝试免费的iMacros Firefox插件。它有广泛的web scraping支持,并且因为它在浏览器中工作,它可以处理Javascript。您也可以通过command line启动它。

编辑:这确实有效。这是一个下载过去3天销售报告的宏。我还没有尝试与命令行工具集成,但它应该工作。

VERSION BUILD=6650406 RECORDER=FX 
TAB T=1 
URL GOTO=https://itunesconnect.apple.com/ 
TAG POS=1 TYPE=INPUT:IMAGE FORM=NAME:appleConnectForm ATTR=NAME:1.Continue&&SRC:https://itunesconnect.apple.com/AppleConnect/US-EN/labelconnect/btn_signin.png 
TAG POS=1 TYPE=B ATTR=TXT:Sales<SP>and<SP>Trends 
TAG POS=1 TYPE=A ATTR=ID:theForm:saletestid 
TAG POS=1 TYPE=SELECT FORM=NAME:theForm ATTR=ID:theForm:datePickerSourceSelectElementSales CONTENT=1 
TAG POS=1 TYPE=A ATTR=ID:theForm:downloadLabel2 
ONDOWNLOAD FOLDER=~/Downloads/iTCSales/ FILE=Daily-{{!NOW:yyyymmdd}}-1.txt.gz WAIT=YES 
TAG POS=1 TYPE=SELECT FORM=NAME:theForm ATTR=ID:theForm:datePickerSourceSelectElementSales CONTENT=2 
TAG POS=1 TYPE=A ATTR=ID:theForm:downloadLabel2 
ONDOWNLOAD FOLDER=~/Downloads/iTCSales FILE=Daily-{{!NOW:yyyymmdd}}-2.txt.gz WAIT=YES 
TAG POS=1 TYPE=SELECT FORM=NAME:theForm ATTR=ID:theForm:datePickerSourceSelectElementSales CONTENT=3 
TAG POS=1 TYPE=A ATTR=ID:theForm:downloadLabel2 
ONDOWNLOAD FOLDER=~/Downloads/iTCSales FILE=Daily-{{!NOW:yyyymmdd}}-3.txt.gz WAIT=YES 
TAG POS=1 TYPE=DIV ATTR=TXT:Done 
TAG POS=1 TYPE=DIV ATTR=TXT:Done 
TAG POS=1 TYPE=INPUT:SUBMIT FORM=NAME:signOutForm ATTR=VALUE:Sign<SP>Out 
+0

我通常不使用Windows,所以我讨厌保持虚拟机与Windows和Firefox只是运行此。我看到有一个Chrome版本,所以我会看看这是否是跨平台的。 – 2010-09-10 11:42:57

+0

不要介意我以前的评论--iMacro在Mac OS X上可以工作。我想我一直在看IE插件的系统需求页面。 – 2010-09-10 14:10:09