我目前正在使用Perl脚本,并使用CPAN模块WWW:通过机械化从网站获取HTML页面。 但是,我希望能够在离线HTML文件上工作(我会事先保存好自己),所以每次尝试新脚本时都不需要互联网。 所以基本上我的问题是如何改变这样的:使用perl WWW ::对本地文件进行机械化
$mech->get('http://www.websiteadress.html');
到这一点:
$mech->get('C:\User\myfile.html');
我见过的文件://可能是有用的,但我显然不知道如何使用它,因为我每次都会遇到错误。
您确定要使用'上的本地文件WWW :: Mechanize'?当你只需打开文件时,使用'LWP'套件就没什么意义了,模块的许多用途是处理对链接的点击,表单填写和提交以及在浏览器上模拟后退和前进按钮。这些都不是静态文件可能的,所以你只剩下页面的分析,你只需要[HTML :: TreeBuilder](https://metacpan.org/pod/HTML::TreeBuilder) WWW :: Mechanize'子类。 – Borodin
正如我所说的脚本的目的是在网页上工作,本地文件只是一个替代方案,主要是为了测试编码错误(我真的想知道为什么它不起作用!)。感谢您指出另一种方式来做到这一点。 – Azaghal