【发布时间】:2015-12-15 09:25:02
【问题描述】:
如何删除文档中特定元素的所有属性。我正在尝试这样的事情:
from bs4 import UnicodeDammit
from lxml import html
content = open("source.html").read()
document = UnicodeDammit(content, is_html=True)
parser = html.HTMLParser(encoding=document.original_encoding)
root = html.document_fromstring(content, parser=parser)
for attr in root.xpath('.//table/@*'):
del attr.attrib
这里我尝试使用 xpath 从文档中的所有表中删除所有属性,但它不起作用。
【问题讨论】:
-
是的,但考虑到 xpath 应该是这样的:
...
应该变成...