BeautifulSoup 将 Breaks 转换为 python 换行符

【问题标题】：BeautifulSoup convert Breaks into python newlinesBeautifulSoup 将 Breaks 转换为 python 换行符
【发布时间】：2026-01-18 00:35:02
【问题描述】：

我有一个 html 表格，每个单元格包含多行文本和数据，我试图最终提取这些表格，并且他们使用中断来提高网站的可读性。这是一个这样的单元格的示例：

<td class="cell">-<br>21%<br>1<br>
<font color="red">5001</font><br>12%
                </td>

如何将这些换行符转换为与 Pandas 兼容的换行符（即会有一个由 \n 分隔的 4 行字符串）？

使用这个sn-p：

for cell in soup.find_all('td'):
    cell.replace_with(cell.get_text('\n',strip=True))

为表中的每个条目生成 NaN 值。

【问题讨论】：

你想把整个字符串放在一个 Pandas 单元格中吗？
我必须将每个单元格中的某些行与其他行匹配，所以我认为这部分可能更容易处理，比如 pandas 中的爆炸

标签： python python-3.x pandas beautifulsoup newline

【解决方案1】：

您可以将'br' 替换为'\n'：

for linebreak in soup.find_all('br'):
    linebreak.replace_with('\n')

希望对您有所帮助。

【讨论】：

当我尝试这个时，我确实在新行上得到了我的字符串，但是导入 pandas（通过 read_html）删除了所有的换行符

猜你喜欢

需要通过python将HTML字符串转换为Text 2026-01-15
键入将字符串转换为多行版本 2026-01-04
将字符串转换为数组 2026-01-10
如何将“字符串”转换为“变量”Python 2.7？ [复制] 2026-01-16
将 std::string 转换为 Swift 字符串 2026-01-09
如何将字符串转换为 CFMutableString？ 2026-01-03
将二维列表转换为字符串 2026-01-03
PySpark - 在执行器中将 python 数据结构转换为 RDD 2026-01-11
将 url 转换为 bit.ly 2026-01-09

相关资源

CmsTop 转换程序 v1.0 build 20100924下载 2022-12-13
batch-replace PHP 批量替换程序(替换木马)下载 2023-03-04
jQuery 图片切换（超炫效果）下载 2023-02-01
jQuery带遮罩高亮图片旋转木马滑动切换特效源码下载 2023-06-02
jQuery 图片广告轮番切换特效下载 2023-01-23

最近更新更多

热门标签

Java Python linux javascript C# Mysql Docker 算法前端 SpringBoot Redis Vue spring .net 设计模式 .net core c++ kubernetes 数据库机器学习大数据数据结构微服务 js 人工智能 Go Android 面试程序员 JVM 云原生后端 ASP.net core 深度学习 CSS k8s git golang PHP devops Nginx Django React mybatis 架构多线程 Spring Boot 云计算 LeetCode 分布式