【问题标题】:Subcategories of wikipedia pages维基百科页面的子类别
【发布时间】:2012-04-04 03:12:22
【问题描述】:

有没有一种方法可以获得某个类别的所有子类别?我的意思是说如果我只想存储类别计算机科学及其所有子类别的页面。我希望我足够清楚。

【问题讨论】:

    标签: python mediawiki wikipedia


    【解决方案1】:

    MediaWiki 中的子类别只是属于另一个类别的成员的类别——它们在这方面与文章没有什么不同,因此您可以通过搜索也是类别的类别成员来查找它们。例如,这是一个 API 查询,它查找 Category:Dogs 的子类别。 (命名空间 14 是类别命名空间。)

    https://en.wikipedia.org/w/api.php?action=query&list=categorymembers&cmnamespace=14&cmlimit=100&cmtitle=Category:Dogs

    请注意,这意味着不能保证类别会形成层次树!事实上,它们通常不会——许多类别是多个其他类别的成员,并且围绕抽象主题经常存在循环。例如:

    【讨论】:

    • 你说得对,循环确实存在,但它们不应该存在。它们只是错误。
    • 错误与否,它们使无限深度子类别遍历变得不切实际。
    • 我不认为他们是错误的。这篇博文解释了很多:nlpers.blogspot.com.br/2012/02/…(不幸的是,似乎没有正确的方法可以做到这一点)。
    • 将类别视为标签,而不是层次结构。一些标签恰好应用了其他标签。这并不意味着任何总体结构,它只是意味着两者之间存在某种关系。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2017-07-18
    • 2019-03-15
    • 2010-12-26
    • 1970-01-01
    • 1970-01-01
    • 2021-04-23
    • 2022-01-10
    相关资源
    最近更新 更多