【问题标题】:How do I integrate wikipedia data to my local mediawiki?如何将维基百科数据整合到我的本地媒体维基?
【发布时间】:2023-03-19 10:29:02
【问题描述】:

我已经建立了一个本地 mediawiki 实例。它运行良好。现在我想要整个维基百科在本地。

我找到了这个转储:https://dumps.wikimedia.org/enwiki/latest/

我要下载哪些文件?

下载后,如何设置将数据推送到 mediawiki?

我使用:https://github.com/rlewkowicz/docker-mediawiki-stack 在我的 AWS 实例上设置 MediaWiki。

我的最终目标是使用我的 AWS 实例中的 Wikipedia Search API,而不是公开可用的端点。

【问题讨论】:

    标签: mediawiki wikipedia wikipedia-api mediawiki-api


    【解决方案1】:

    维基百科转储很大,您的安装可能会崩溃。如果您想尝试一下,mwdumper 可能是 xml 文件的最佳选择。它维护得不是很好。我认为没有任何开箱即用的解决方案可以自动推送更新。

    【讨论】:

    • 您好,该转储中有很多 xml 文件。我要下载哪些??
    • 取决于你想要什么。如果您使用基于时间戳的 URL(例如 dumps.wikimedia.org/enwiki/20170520 ),您将获得一些关于什么是什么的信息。
    猜你喜欢
    • 1970-01-01
    • 2013-05-07
    • 2019-07-10
    • 1970-01-01
    • 1970-01-01
    • 2017-04-30
    • 2019-09-15
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多