2012-05-09 63 views
4

是否有可能得到一个网页的HTML源代码与curl和运行JavaScript解释器,所以我得到生成的内容?javascript执行后得到源代码curl

我需要得到的页面使用了一些编码和生成的内容,所以我想先运行javascript来获得转义和生成的内容......或者我需要正则表达javascript和“编译”javascript我自己?像

curl <myurl> | perl -ne 'm/unescape\((.*)\)/; print "$1"' | <now to something with that> 

我知道没有JavaScript引擎在curl中,但我可以调用另一个脚本/程序来完成这项工作吗?

+0

试试这个:http://stackoverflow.com/a/28506533/3063226 – Heitor

回答

10

你可以做到这一点,但它比我认为你意识到的更多。 curlwget都没有Javascript引擎,所以你需要有一个。

我会先看PhantomJS

+0

不错,我不知道那里有这样的东西:)我也会更新我的屏幕截图脚本,它目前会覆盖一些边缘,然后使用phantomjs! – reox