2016-07-15 110 views
0

我有一个包含多个网址的文件这样的文件下载的文件的文件名:阅读使用PowerShell

http://ligman.me/1HCDxl9 
http://ligman.me/1HCCCRP 
http://ligman.me/1HCCCRP 
http://ligman.me/1H4Q0e5 
http://ligman.me/1H4Q0e5 
http://ligman.me/1JI6V77 
http://ligman.me/1JI6V77 
http://ligman.me/1CSMobd 
http://ligman.me/1CSMobd 

我想写一个PowerShell脚本将逐行读取该文件中的行,然后下载每行后面的文件(URL)。到目前为止,我已经设法使用以下脚本下载文件:

$reader = [System.IO.File]::ReadLines("C:\Temp\Ebooks\ebooks.txt") | Where-Object { $_ -ne '' } 
$targetDir = "C:\Temp\Ebooks\" 
$wc = New-Object System.Net.WebClient 

foreach($file in $reader) {  
    $sourceFileName = $file.SubString($file.LastIndexOf('/')+1) + ".pdf" 
    $targetFileName = $targetDir + $sourceFileName 
    $wc.DownloadFile($file, $targetFileName) 
    Write-Host "Downloaded $file successfully to directory $targetDir" 
} 

我的问题是文件名。现在,我只能将它们保存为PDF格式,但有时文件不是PDF文件,而是DOCX或XLSX。另外,如果它们不被命名为1225DID或13DChwr,那将会很好。基本上,我仍然需要读取实际的文件名,然后用该名称保存下载的文件。

我该怎么做?

编辑:这是工作得到实际的文件名,但当我尝试打开文件时,我得到一个错误,他们不是PDF或已损坏(只要我尝试用福昕阅读器打开PDF文件)

$reader = [System.IO.File]::ReadLines("C:\Temp\Ebooks\ebooks.txt") | Where-Object { $_ -ne '' } 
$targetDir = "C:\Temp\Ebooks\" 
$wc = New-Object System.Net.WebClient 

$reader | %{  
    $uri = $_ 
    $request = Invoke-WebRequest -Uri $uri -MaximumRedirection 0 -ErrorAction Ignore 

    $sourceFileName = $request.Headers.Location.SubString($request.Headers.Location.LastIndexOf('/') + 1) 
    $targetFileName = $targetDir + $sourceFileName 
    $wc.DownloadFile($file, $targetFileName) 
    Write-Host "Downloaded $file successfully to directory $targetDir" 
} 
+0

您能分享您试图目标实际的URL之一,之类的东西的例子具有相同的格式? – Bassie

+0

确定我编辑为网址,它们应该现在有效 – LeonidasFett

+0

我已经尝试阅读这些文件的内容处置,但它似乎只有“附件”作为值,没有别的。 – LeonidasFett

回答

2

使用小提琴手,似乎在场景后面有一个重定向。

如果您执行以下脚本,则会在您提供的URL后面显示“真实”URL。

$links = @(
    "http://ligman.me/1HCDxl9", 
    "http://ligman.me/1HCCCRP", 
    "http://ligman.me/1H4Q0e5", 
    "http://ligman.me/1JI6V77", 
    "http://ligman.me/1CSMobd" 
) 

$links | %{ 
    $uri = $_ 

    $request = Invoke-WebRequest -Uri $uri -MaximumRedirection 0 -ErrorAction Ignore 
    Write-Host $request.Headers.Location 
} 

此脚本生成以下列表,其中包含文档名称及其扩展名。

http://download.microsoft.com/download/4/2/f/42f9b256-977e-4792-a9eb-d490516d4468/AF103733558_en-us_access2013quickstartguide.pdf 
http://download.microsoft.com/download/6/7/5/675609de-a32b-44d4-ace6-86305afb808f/AF103733448_en-us_word2013quickstartguide.pdf 
http://download.microsoft.com/download/2/8/7/28747b20-70b0-4003-b82a-5ab0d222bbd6/AF103733495_en-us_publisher2013quickstartguide.pdf 
http://download.microsoft.com/download/e/6/f/e6fc74dc-9f0d-4e6c-bbcc-6855e4d7a78c/AF103733479_en-us_project2013quickstartguide.pdf 
http://download.microsoft.com/download/c/e/b/ceb742d6-bc1f-4447-ad06-b0842338dd8c/AF103733547_en-us_onenote2013quickstartguide.pdf 

这里是一个版本,下载为我的作品文件:

$links | %{ 
    $uri = $_ 

    $request = Invoke-WebRequest -Uri $uri -MaximumRedirection 0 -ErrorAction Ignore 
    $location = $request.Headers.Location 
    $output = "D:\temp\" + $location.SubString($location.LastIndexOf('/') + 1) 

    Invoke-WebRequest -Uri $location -OutFile $output 
} 
+0

这是完美的,我现在有实际的文件名。但是,打开文件时出现错误,例如PDF文件损坏。我试图打开哪一个并不重要,它总是一样的。请参阅我的问题以获取更新的代码。 – LeonidasFett

+0

编辑答案给出一个下载示例。 –