网页抓取中的间距[重复]答案

【问题标题】：Spacing in web scraping [duplicate]网页抓取中的间距[重复]
【发布时间】：2021-03-31 16:03:31
【问题描述】：

我有以下 html 代码，我从其中提取文本“蛋白质家族的分类”，并在 python 中使用 BS。

<h1 class="item-title__primary">

    
        Classification of protein families

但是，当我将数据导出到 Excel 文件时，文本带有很多空格。我该如何克服这个问题？谢谢你。

网页抓取代码：

titles.append(soup.find('h1',class_='item-title__primary').text)

【问题讨论】：

【解决方案1】：

e = "  word  "

print(e.strip())

# "word"

e = "word  and  word 2"

print(e.replace("  ", " "))

# word and word 2

【讨论】：