我目前正在研究解析包含欧洲基金会数据的网站。PHP简单的HTML DOM或Python-BSoup:哪一种更简单?
http://www.foundationfinder.ch/其中有790个基础的数据集。所有数据都可以免费使用 - 版权不受限制。
目标是什么:我想解析数据并将其保存在本地:为了更好的检索和更方便的使用方式:也许可以将它存储到Calc /或甚至更好的MySQL数据库。
问题:用Perl解析HTML的最简单方法是什么 我应该使用LWP还是机械化:哪一种更简单?
有些朋友告诉我试用Python!美丽的汤。我想到了一个Perl LWP或Python美丽汤的方法。其他解决此类网站的方法我无法看到。好的,有一种方法 - 使用PHP。当然,不知何故我们可以使用PHP(和Curl)
哪种方法最好。 Perl与LWP或机械化?或者Python的...?
除了语言的问题:任何人都可以在第一步帮助我。 - 帮助走上赛道!?我期待着听到您
问候 零
以下哪种语言最流利?绝对而言,Perl可能是最适合这项任务的情况,但如果您最适合使用PHP,那么这最终会更加重要。 – Schwartzie 2011-05-14 13:26:56
如果你对PHP很好,我建议使用带有XPath的PHP DOM类。这很容易。 – Thai 2011-05-14 13:36:40
Hi Schwartzie,你好泰国 - 非常感谢你的快速回答。我对PHP有点熟悉 - 所以我想我必须去PHP方式。这些想法很好,但我不知道我可以自己做所有的工作。泰语 - 你可以用一些片段来支持一下,看看如何使用PHP做这件事来加快速度!?我喜欢听到你的回复 – zero 2011-05-14 13:46:48