【发布时间】:2021-03-31 16:03:31
【问题描述】:
我有以下 html 代码,我从其中提取文本“蛋白质家族的分类”,并在 python 中使用 BS。
<h1 class="item-title__primary">
Classification of protein families
但是,当我将数据导出到 Excel 文件时,文本带有很多空格。我该如何克服这个问题?谢谢你。
网页抓取代码:
titles.append(soup.find('h1',class_='item-title__primary').text)
【问题讨论】: