2017-05-30 68 views
0

我设置了一个本地mediawiki实例。它运行良好。现在我想在整个维基百科本地。如何将维基百科数据集成到本地mediawiki?

我发现这个转储:https://dumps.wikimedia.org/enwiki/latest/

我下载哪个文件?

下载后,如何设置将数据推送到mediawiki?我使用的是:https://github.com/rlewkowicz/docker-mediawiki-stack在我的AWS实例上设置MediaWiki。

我的最终目标是使用AWS实例中的Wikipedia Search API,而不是公共可用的端点。

回答

0

维基百科转储很大,您的安装可能会崩溃。如果你想尝试,mwdumper可能是你最好的选择xml文件。这不是很好维护。我不认为有自动推送更新的现成解决方案。

+0

嗨,该转储中有很多xml文件。我下载哪些? –

+0

取决于你想要的。如果您使用基于时间戳的URL(例如https://dumps.wikimedia.org/enwiki/20170520/),您可以获得有关什么是什么的信息。 – Tgr