【发布时间】:2016-05-31 11:55:01
【问题描述】:
在BeautifulSoup中,.text和.get_text()有什么区别吗?
获取元素的文本应该首选哪一个?
>>> from bs4 import BeautifulSoup
>>>
>>> html = "<div>text1 <span>text2</span><div>"
>>> soup = BeautifulSoup(html, "html.parser")
>>> div = soup.div
>>> div.text
'text1 text2'
>>> div.get_text()
'text1 text2'
【问题讨论】:
-
基本上你可以使用
get_text()的自定义分隔符,你应该使用它,因为.text是一个私有属性,甚至没有记录。 -
@Selcuk 是的,我个人一直在使用
get_text(),主要是因为它被明确记录在案,但我看到很多 bs4 用户直接使用.text并且很好奇的缺点。谢谢! -
嗯...那
div.string是什么?
标签: python html beautifulsoup html-parsing