2014-09-25 65 views
0

我在Window机器上使用wget。我只想要pdf文件。如果应用程序/类型是pdf。只允许允许Wget只下载应用程序类型的PDF

我使用这个命令

wget --accept pdf www.google.com 

它下载谷歌的索引页进行下载。

长度:19404(19K)的text/html]保存到: `[email protected]_rd=cr & EI = 5O8jVLycNuvA8gftoYGIBg”

我不想允许。如果只有pdf。

任何想法

感谢

回答

1

正常情况下应该

的wget --header = '接受:应用/ PDF' www.google.com

但谷歌.com似乎忽略了Accept:标头,因此您可能需要

wget --debug --header ='接受:application/pdf'www.google.com 2> & 1 | grep'Content-Type:application/pdf'

并测试该命令的结果。

+0

它是stil下载html文件 – Hitu 2014-09-25 11:10:31

+0

正如我所说的Google忽略标题。您的工作是检查上述命令的状态,如果状态不成功,则忽略该文件。没有其他办法。 对于正确处理Accept头的服务器,它们不会发送除PDF之外的任何内容(如果存在PDF资源)。 – dee 2014-09-25 11:18:57