【发布时间】:2011-05-03 19:33:17
【问题描述】:
我正在尝试解析一些 html。我想要sgmllib 之类的东西,但它在 python 3.2 中已被弃用。
是否有我可以使用的替代模块?
谢谢。
【问题讨论】:
标签: python html python-3.x
我正在尝试解析一些 html。我想要sgmllib 之类的东西,但它在 python 3.2 中已被弃用。
是否有我可以使用的替代模块?
谢谢。
【问题讨论】:
标签: python html python-3.x
内置 HTMLParser 模块: http://docs.python.org/py3k/library/html.parser.html
不是本地人,但值得一提; 美丽汤: http://www.crummy.com/software/BeautifulSoup/
【讨论】:
sgmllib 非常相似。我还阅读了很多关于 BeautifulSoup 的内容,人们抱怨 Python 3 的兼容性问题。谢谢。
不知道你说的原生是什么意思,但我是lxml 的忠实粉丝。
【讨论】: