2016-10-03 68 views
-1

我试图找到包含pageIds和标题的维基百科转储。我不想在运行时请求它或请求2000每个请求,我希望它所有,我想做一个属于他们的所有pageIds和标题的长列表,并将它们放入我自己的数据库,以便我可以使用它在一个从我自己的数据库请求数据的应用程序中。维基百科转储所有页面标题和页面标识

有人知道哪些转储包含这些信息吗?不要紧,如果他们还包含更多的信息,我需要什么 - 我可以写一个应用程序,选择我需要的信息。

我确实试图请求它......这将需要140天,他们提出了2700个请求的限制...所以它需要永久获得整个事情,而不是我想下载一个文件哑巴和清理数据和文件上传到只包含信息我自己的数据库,我需要

回答

-1

好吧发现自己越来越多转储后,在很短的答案是: enwiki - 最新-page.sql.gz

它包含pageids和Titles。

条目是这样的: (1217768,0, 'Black_River_(South_Carolina)', '',0,0,0,0.6285160577990001, '20161001141146', '20161001142916',738899573,1654, 'wiki文字')

第一个数字是pageId。第三项是标题。

休息我不知道是什么 - 但不管:D感谢我自己我解决了这个问题,并将其关闭:D大包拍拍

相关问题