【问题标题】:Wikipedia page parser for iPhone App projectiPhone App 项目的维基百科页面解析器
【发布时间】:2012-03-12 13:14:01
【问题描述】:

我想解析一个 wikipedia 页面以检索我的 ios 应用程序的信息,有一个解析器或一些教程可以解释我如何做到这一点?...或者将页面置于 xml 格式,我已经查看http://www.mediawiki.org/wiki/MediaWiki 页面,但我什么都不懂,如果有人可以帮助我,请......也许有一些例子......

【问题讨论】:

  • 有一个维基媒体API;但是您将首先了解如何在 iOS 中使用 Web 服务。我不会专注于 Wikipedia,而是先从一个好的 Web 服务教程开始。 Here's one
  • 我已经知道如何在 ios 中使用 Web 服务,但我无法理解如何解析维基百科页面...
  • 在这种情况下,请转到MediaWiki API page。向下滚动到“一个简单的示例”部分。使用提供的 URL 创建 HTTP GET 请求。返回的数据将是标记页面的返回 XML 内容。
  • 好的,我明白了,但似乎不是一个 xml 页面,这是一个没有部分的完整文本...

标签: iphone ios parsing wikipedia


【解决方案1】:

您是否阅读过MediaWiki API pagedescribes the Query action 的页面以及最重要的API FAQ?这些链接将告诉您应该使用哪些 URL 来获取所需的数据。

你知道如何下载带有NSURLConnection的网址吗?

首先,尝试使用他们的 API 以 HTML 格式下载您选择的维基百科页面。他们的常见问题解答中有一个答案告诉您如何请求 HTML 格式。如果您这样做,您将获得可以在 Web 视图和样式中显示的内容。

【讨论】:

  • 我已经知道我可以从我的应用程序中获取 html 页面,但我不会显示网页,我想获取某些页面的一些信息并将其保存在我的应用程序中......跨度>
  • 我提到的 HTML 格式与普通的 HTML 页面不同——它只是 wiki 页面的内容,没有所有的导航和样式。到目前为止,这将是您最简单的方法。如果你真的不想那样做,那么首先你需要在 API 文档中寻找让它返回 XML 格式的方法——它会向你发送 WikiText 中的文章内容。要解析 WikiText,您还有很长的路要走……您可以使用 KiwiWikiparser 作为起点,但它们是基于 C 的复杂解析器……
  • 感谢您的回答,在 MediaWiki Api 页面中,有 xml 格式的 url 示例,en.wikipedia.org/w/… 但是当我打开它时,没有带有该部分的经典 xml 页面,有中间一整段文字,是xml格式吗?
  • 那是维基文本。这就是我所说的很难解析:)
  • 向这个问题迈出了一步。假设我们基于一些关键字进行解析并发布一个 iOS 应用程序,我们是否不相信 wikitext 中的关键字和结构将来不会改变这一事实?是否有任何防故障方法来解决此类情况?
猜你喜欢
  • 2015-05-08
  • 2016-03-27
  • 2011-04-22
  • 1970-01-01
  • 1970-01-01
  • 2019-01-25
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多