【问题标题】:Parsing Wiki API content解析 Wiki API 内容
【发布时间】:2011-06-28 05:39:48
【问题描述】:

我有这个来自 API http://fr.wikipedia.org/w/api.php?action=query&titles=%C9rythropo%EF%E9tine&prop=revisions&rvprop=content&format=xmlfm 的维基

我要检索的主要内容从:

L''''érythropoïétine''' ('''EPO''') est une [[hormone]] ......etc

我尝试使用这个开始 preg_replace 从“{{Chimiebox...”这个词开始到底部“}}”的所有内容

preg_replace( '/^{{(.*)}}$/sim', '', $value[0]['*'] );

但是有点行不通..有人知道确定内容开始的好方法吗?感谢您的建议。

【问题讨论】:

    标签: php wiki wikipedia-api


    【解决方案1】:

    嗯,afaik 大多数项目直接使用维基百科解析器,例如我大学的Wikipedia Offline Client Project。由于您似乎使用的是 php,这可能是您最简单的方法。

    【讨论】:

    • 感谢 Zeis,似乎是一个完整的包框架,有点矫枉过正,因为我只需要获取 wiki 内容,但仍然感谢,我会看看它是否有帮助。赞赏。
    • 我给你的链接只是一个例子。不需要像他们那样使用它。
    猜你喜欢
    • 1970-01-01
    • 2014-03-08
    • 1970-01-01
    • 2014-02-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-09-04
    • 1970-01-01
    相关资源
    最近更新 更多