2010-03-18 82 views
0

我目前正在设计一个专注的web爬行器。我有一些网站进行测试,直到我遇到了下面的锚(以下简称 “< A HREF =” ... “>):从Javascript获取文档HREFS

HREF =” JavaScript的:使用openDocument( 'DATA // PCP200803.pdf'); “

我的HTML解析程序结果

的javascript:使用openDocument( 'DATA // PCP200803.pdf');

没有人有任何关于如何下载参考文件的想法?

非常感谢。

回答

0

openDocument()命令的情况下,你可以只添加“DATA/PCP200803.pdf”到其他资源的采集获取/爬行,相同页面中的任何其他超链接。其他JavaScript方法(例如XMLHttpRequest的open())可能并不那么简单。

+0

谢谢ImJasonH。我实际上期待的是,如果有一个很好的第三方实用程序可以提供更高级别的解析这些javascript hrefs,因为我假设可能有很多这些类型的hrefs的不同实例。反正,tnx :) – Jojo 2010-03-18 06:45:22