【问题标题】:BeautifulSoup - Get text from tag even if it has other tags insiseBeautifulSoup - 从标签中获取文本,即使它里面有其他标签
【发布时间】:2019-11-29 15:50:59
【问题描述】:

假设我有以下列表:

l = [<p>NC:<strong> 1</strong></p>, <p>APC<strong> 2</strong></p>, <p>GED<strong> 3</strong></p>]

并且该列表中每个元素的类型都是 bs4.element.Tag

我想要的是一个看起来像这样的列表:

ll = ['NC: 1','APC: 2','GED: 3']

我试图做的是这样的:

ll = [element.get_text() for element in l]

但它会返回:

['NC:\xa01', 'APC:\xa02', 'GED:\xa03']

在我看来,&lt;strong&gt;&lt;/strong&gt; 之间的空格似乎有些问题。有什么方法可以解决这个问题?

【问题讨论】:

    标签: python string parsing beautifulsoup space


    【解决方案1】:

    好的,我找到了答案,方法是:

    ll = [entrance.get_text(strip=True) for entrance in l]
    

    【讨论】:

      猜你喜欢
      • 2022-11-01
      • 1970-01-01
      • 2017-04-25
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2015-01-27
      • 2019-04-14
      • 2021-07-22
      相关资源
      最近更新 更多