2012-08-09 78 views
1
我使用Perl作为本次作业的唯一语言

创建Web蜘蛛/机器人脚本需要帮助在Perl

我的目的:

要创建一个Perl脚本,将创建一个Web蜘蛛/机器人。 我的脚本将从互联网上下载一个网页,搜索并提取Metatags, 然后将它们编入MySQL数据库中。

我的数据库可以通过元标记字段或通过网页界面的URL进行搜索。

我的脚本还会显示完整的数据库,其中包含一个列出数据库中记录数量的特殊字段。

所以我的问题是:

我该如何去有关网络蜘蛛会从互联网下载的网页,并提取元标记创建一个脚本?

我可以阅读哪些资源来帮助我创建此文件或任何脚本?

谢谢你的时间!

+2

看看WWW :: Mechanize。 – 2012-08-09 21:36:27

+2

如果您使用Perl,您可能会开始查看cpan中的各种HTTP模块:http://www.cpan.org/modules/index.html。 (你可以在那里找到Sebastian建议的WWW :: Mechanize) – scrappedcola 2012-08-09 21:37:00

+0

感谢您的建议。我不知道该网站大声笑 – Umeed 2012-08-09 21:40:09

回答

3

您的教授。假设您将掌握一些关于Perl的知识并使用CPAN模块。如果你不知道CPAN,那么开始here。一旦您熟悉如何安装和使用来自CPAN的模块,请安装其中一个模块,并开始编写代码。

“我如何去创建脚本”太笼统了。如果您是Perl新手,请尝试使用Impatient PerlPerl.org或各种tutorial sites的任何其他资源。

+0

谢谢!我一直在查看这些资料,现在我有点揪心。 LWP :: Simple从字面上看非常简单。你的答案基本解决了我的问题。谢谢 – Umeed 2012-08-10 00:18:59

+0

很高兴有帮助。 :) – Hameed 2012-08-10 00:38:07