【问题标题】:Parsing HTML easily like PyQuery in Python 2.5像 Python 2.5 中的 PyQuery 一样轻松解析 HTML
【发布时间】:2011-04-05 07:20:55
【问题描述】:

我正在为 GAE(Python 2.5)编写一个应用程序,我想知道是否有像 PyQuery(在 Python 2.6+ 上运行)这样的库。

我所要做的就是加载一个 HTML 文件并通过其 ID 获取特定标签的内容。在 PyQuery,甚至 Python2.6 的 lxml 之类的库中,这很容易,但我不知道如何在 Python 2.5 中做到这一点。

有人可以帮助我吗? ^^

谢谢你们。 :)

【问题讨论】:

  • PyQuery 主要依赖于 lxml,这是一个可用于 Python 2.3 或更高版本的第三方库,完全包括 2.5 和 2.6 ——不幸的是,在 GAE 上可用,请参阅例如stackoverflow.com/questions/1894696/python-lxml-on-app-engine 。这不是 2.5 与 2.6 的问题!请编辑您的问题以修复相关的错误断言和含义(这可能会使其他人感到困惑),谢谢。至于您的 Q,现有的建议 BeautifulSoup 的答案(它是纯 Python,因此对 GAE 来说很好)很好——但是,一定要获得 BS 3.0.8.1,not BS 3.1!
  • BeautifulSoup 版本 3.2.0 与 GAE 怎么样?这是现在的版本..

标签: python html google-app-engine


【解决方案1】:

BeautifulSoup 应该是您要查找的内容。

【讨论】:

    【解决方案2】:

    BeautifulSoup 是 HTML 解析的常用选择,与 Python 2.5 兼容。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-11-10
      • 2013-05-07
      • 2014-11-19
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-07-11
      相关资源
      最近更新 更多