我对状态感到困惑。网址在网址中的前缀
我下载HTTP页面:// tukaani.org/xz/format.html,并希望按照HREF在HTML,但是,链接像 < A HREF =“XZ-文件格式1.0 .4.txt“> 指向http:// tukaani.org/xz/xz-file-format-1.0.4.txt而不是http:// tukaani.org/xz-file-format-1.0.4。文本'。
我怎么能得到的URL的前缀,它不是主机名或基地,我找不到任何有用的信息在头,有没有字符串像'http:// tukaani.org/xz/'在标题。但任何浏览器都知道链接。
什么是内部机制。如何在'http:// tukaani.org/xz/format.html'中使用wget,curl或perl获取前缀'http:// tukaani.org/xz/'?
HTTP是协议其他选项的文件: // ftp://和https://然而,在你的问题中存在一个极度缺乏清晰度的问题。 –
我修改了我的问题,没有出现,如果我没有把<和一个 – SetupX