【发布时间】:2018-11-01 12:52:12
【问题描述】:
我正在使用Wikipedia-api 从给定类别的维基百科页面中提取所有文本。
如教程中所述-
def print_categorymembers(categorymembers, level=0, max_level=2):
for c in categorymembers.values():
print("%s: %s (ns: %d)" % ("*" * (level + 1), c.title, c.ns))
if c.ns == wikipediaapi.Namespace.CATEGORY and level <= max_level:
print_categorymembers(c.categorymembers, level + 1)
cat = wiki_wiki.page("Category:Physics")
print("Category members: Category:Physics")
print_categorymembers(cat.categorymembers
但我无法构建逻辑,如何做,这段代码只是给了我所有的页面和一些嵌套到其他页面的页面。 怎么办?
【问题讨论】:
标签: python-3.x web-scraping web-crawler wikipedia-api