【问题标题】:Missing line breaks in cells after importing Excel spreadsheet into Pandas DataFrame将 Excel 电子表格导入 Pandas DataFrame 后单元格中缺少换行符
【发布时间】:2018-11-10 02:29:38
【问题描述】:

我正在使用 Python Pandas 将 Excel 电子表格 (xlsx) 导入数据框。 Excel 电子表格在某些列中包含文本。下面给出了一个带有多行文本的示例单元格:

document belongs to family 13: 
claims are important. 
description discloses a bycicle with 3 wheels.
assigne is well known Trudi Bikes Inc.

单元格包含换行符。该示例有 4 行。问题是在将价差导入数据框时,换行符会丢失。所有行合并为一行。

据我所知,Excel 添加了带有特殊字符 CHR(10) 等的换行符。

因此,我的问题是:在将电子表格(或换行符)导入 pandas 数据框时,是否有办法保留这些特殊字符?我不介意在其中包含转义序列之类的东西数据框单元格的字符串。

问候,

文兹

【问题讨论】:

    标签: python excel pandas import line-breaks


    【解决方案1】:

    通过这种方式,我将\n 保留在df中:

     df = pd.read_excel(yourfile, 'Sheet1')
    

    输出:

                     col1     col2      col3
    0  hello\ncome in\ngo    hello        hi
    1                 bye  bye bye  bye\nbye
    

    【讨论】:

    • 嗨,乔,感谢您的反馈。我能够重现您的结果。它有助于继续。在我的测试中,我通过 df.iloc 打印了单个单元格,结果是 \n 没有打印。在进一步争论数据时,我完全丢失了换行符。谢谢!文兹
    • @VinzFrauchiger 欢迎您。如果答案对您有帮助,请考虑点赞并接受它:)
    猜你喜欢
    • 2014-01-25
    • 2016-08-28
    • 2019-12-25
    • 1970-01-01
    • 2019-09-03
    • 2011-08-09
    • 2010-10-18
    • 1970-01-01
    • 2019-08-26
    相关资源
    最近更新 更多