2017-08-04 73 views

回答

0

的HTTrack似乎能够得到文件从有特殊字符的URL无差错,只要你不跑了“真正的”域爬行,但是:

  • 首先创建一个URL列表,
  • 保存为iso-8859-1
  • 比让HTTrack抓取这个列表

如果HTTrack会自己探索网址,它会在具有特殊字符的网址上遇到404错误 - 至少我无法让它们无错误。也许有人会提供一个神奇的设置;)