我仍然坚持试图从维基百科解析文章的问题。实际上,我希望解析来自维基百科的文章的信息框部分,即我的应用程序提及国家和每个国家/地区页面,我希望能够显示该国家相应wikipedia文章中的信息框。我在这里使用的PHP - 如果有人有任何代码片段或建议我应该在这里做什么,我将不胜感激。如何抓取维基百科文章的解析信息框?
再次感谢。
编辑
嗯,我有国家名称的数据库表。我有一个脚本,需要一个国家,并显示其细节。我想抓取信息框 - 包含所有国家/地区详细信息图片的蓝色框,因为它来自维基百科,并显示在我的页面上。我想知道一个非常简单和容易的方法 - 或者有一个脚本,它只是将信息框的信息下载到本地远程系统,稍后我可以访问自己的远程系统。我的意思是我打开的思想在这里 - 除了最后的结果我希望看到我的网页上的信息框 - 当然,在底部:)
编辑内容很少维基百科的链接
我想我在http://infochimps.org上找到了我正在寻找的东西 - 他们得到了大量的数据集,我认为是YAML语言。我可以直接使用这些信息,但我需要一种不断更新维基百科信息的方法,尽管我相信信息框很少会改变,特别是o国家,除非有些国家决定改变它的首府城市。
这是浪费资源。 – 2009-06-13 06:14:40
对不起 - 我可以看到你的意思是巨大的资源浪费。每次当您网站上的某个人需要查看该网页时,我并不是故意要刮掉网页。我认为你可以在离线状态下(如果你选择这样做)将其存储在应用程序的本地数据库中(对所有相关方而言效率更高)。不是故意吸引火焰! :P – 2009-06-13 06:41:46
@Andrew - 我接受所有可能性 - 但我不确定如何开始。有什么样的工作代码我可以看看开始呢? – Ali 2009-06-13 10:23:15