【问题标题】:beautifulsoup get text by spaces between span tagbeautifulsoup 通过 span 标签之间的空格获取文本
【发布时间】:2022-01-20 17:50:24
【问题描述】:

我有这个代码:

rr = []

bs_add = result.find('span', {'class': 'address'})#.text#.replace('\n', ' ')

print(bs_add)
print(bs_add.attrs)
print(bs_add.get_text())

这段代码给了我这样的结果:

<span class="address"><span>595 Buckingham Way Ste 331</span>San Francisco, CA 94132</span>
{'class': ['address']}
595 Buckingham Way Ste 331San Francisco, CA 94132

本节的问题:给我结果:595 Buckingham Way Ste 331San Francisco, CA 94132

但我需要这样的结果:595 Buckingham Way Ste 331 San Francisco, CA 94132

【问题讨论】:

    标签: python web-scraping beautifulsoup


    【解决方案1】:

    如何实现?

    您已接近目标,只需为您的 .get_text() 方法指定一个字符或字符串,即可将提取的文本位连接在一起 - 在本例中为空格:

    bs_add.get_text(' ', strip=True)
    

    或使用stripped_strings 获得相同的结果:

    ' '.join(bs_add.stripped_strings)
    

    输出

    595 Buckingham Way Ste 331 San Francisco, CA 94132
    

    【讨论】:

    • 上面的另一个代码做bs_add.get_text(' ', strip=True) 并给我结果Showing 1-30 of 2143 1 2 3 4 5 Next 我只想得到数字2143。你能检查一下吗
    • 这将注定ask a new question,因为大概条件以及要选择的标签看起来不同。您应该在您提出的新问题中包含这些详细信息,这很好 - 我们会看到它并进一步帮助您。假设您必须选择更具体的标签。
    • 你可以在这里查看:stackoverflow.com/questions/70807202/…
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-07-26
    • 1970-01-01
    • 1970-01-01
    • 2017-06-29
    • 2022-12-29
    • 1970-01-01
    相关资源
    最近更新 更多