【发布时间】:2011-11-13 01:24:12
【问题描述】:
我正在编写一些将维基百科页面的一部分检索为 NSString 的代码。我在网上找到了一个构造链接,它返回一个部分的原始数据。例如,要获取关于“波士顿”的 Wikipedia 页面的第一部分,您可以访问: http://en.wikipedia.org/w/index.php?title=Boston&action=raw§ion=0.
我想要实现的是将原始数据转换为在正常的 Wikipedia 页面上可以看到的内容:http://en.wikipedia.org/wiki/Boston。
现在,起初,我想我会使用正则表达式来解析以{{ 开头并以}} 结尾的块。然而,这被证明是有问题的,它删除了必要的文本。
然后,我想我可以找到一个用于 Objective-C 的 wiki 标记到 html 转换器(在网上随处可见),但我没有运气。
关于 SO 有几个类似的问题,但似乎都没有得到明确解决:Getting Wikipedia Article Summary using NSScanner Problem。
那么,继续,有谁知道如何将 wiki 页面解析为 NSString?
提前谢谢你。
【问题讨论】:
标签: objective-c regex nsstring wikipedia