【问题标题】:How to get main article for a category using wikipedia dumps?如何使用维基百科转储获取某个类别的主要文章?
【发布时间】:2022-01-24 09:14:45
【问题描述】:

Main article for category

给定任何类别,如果存在,我需要获取相同的主要文章。

【问题讨论】:

    标签: mediawiki wikipedia wikipedia-api wikimedia-dumps


    【解决方案1】:

    您可以使用 Mediawiki 操作 API 来获取有关类别的信息,例如名称空间、名称、排序键前缀。以the query for category:Telegraphy 为例

    {
        "batchcomplete": "",
        "continue": {
            "cmcontinue": "page|2c322a4c304e4032320450324032364c2a4838011701dcbddc0c|21155313",
            "continue": "-||"
        },
        "query": {
            "categorymembers": [
                {
                    "pageid": 30010,
                    "ns": 0,
                    "title": "Telegraphy",
                    "sortkey": "04030650324032364c2a48385a011001c4dc0d",
                    "sortkeyprefix": " ",
                    "type": "page",
                    "timestamp": "2018-05-18T16:59:21Z"
                },
                {
                    "pageid": 35475502,
                    "ns": 0,
                    "title": "Acme Commodity and Phrase Code",
                    "sortkey": "2a2e4232042e46424246303a505a042a44300448384c2a4e32042e463032012201dcc2dcb9dcc0dc07",
                    "sortkeyprefix": "",
                    "type": "page",
                    "timestamp": "2012-04-12T20:44:45Z"
                },
    ....
    }
    

    在结果中,sortkeyprefix 为空格的页面(文章“Telegraphy”的“sortkeyprefix”:“”)是类别的主文章。

    在英文维基百科中,有时您可能会通过使用“Template:Cat main”以及简要说明来找到该类别的主条目。如果您还需要查找此类用法,则需要获取类别页面的 Wikitext 并查找该模板的用法。 (Example)

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-08-06
      • 1970-01-01
      • 1970-01-01
      • 2010-12-06
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多