【问题标题】:What's the best way to process HTML in Python?在 Python 中处理 HTML 的最佳方法是什么?
【发布时间】:2010-11-20 15:46:58
【问题描述】:

我正在尝试使用Lettuce 编写一些测试,开始使用lxml,但发现将它与Django 集成有点复杂,就像Webrat 与Rails 集成一样。

【问题讨论】:

  • this 没有成功吗?
  • 是的,但说实话真的很复杂。

标签: python html bdd lettuce


【解决方案1】:

我用 django 用漂亮的汤,没问题。

http://www.crummy.com/software/BeautifulSoup/

【讨论】:

    【解决方案2】:

    不确定 lxml 复杂的问题是什么(解析 html 会很复杂!)但我一直使用 Beautiful Soup 来处理 html、查找元素、构建树等。

    【讨论】:

    • 是的...我想要一个更简单的解决方案。但我同意定义很复杂。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2010-09-06
    • 2011-09-16
    • 1970-01-01
    • 2017-09-30
    相关资源
    最近更新 更多