【发布时间】:2013-02-13 08:10:28
【问题描述】:
我正在尝试从 xml 解析维基百科页面。 我正在使用 Special:Export 链接来获取带有类似链接的页面的 xml:
http://en.wikipedia.org/wiki/Special:Export/Bruce_Willis
但是当我尝试获取文件或类别页面时,我无法使用此链接,例如,此页面不返回 xml:
http://en.wikipedia.org/wiki/Special:Export/Category:English-language_films
http://en.wikipedia.org/wiki/Special:Export/File:Bruce_Willis_by_Gage_Skidmore.jpg
我找到了解决方案,但我不明白:
- 为页面名称添加命名空间前缀(例如“Help:Contents”), 除非所选命名空间是主命名空间。
- 对其他命名空间重复上述步骤(例如类别:, 模板:等)
我在http://meta.wikimedia.org/wiki/Help:Export 找到了这个解决方案。 请问这是什么意思。
谢谢。
【问题讨论】:
-
您好,我不确定您指的是什么。 en.wikipedia.org/wiki/Special:Export/… 确实为我生成了一个 XML。您是在某个类别中寻找页面列表吗?
-
是的,这就是我要找的