【问题标题】:pd.read_csv sep ";" not working. tricky datasetpd.read_csv sep \";\" 不工作。棘手的数据集
【发布时间】:2022-12-09 15:03:16
【问题描述】:

我为此文件使用pd.read_csv 尝试了不同的堆栈溢出解决方案。 当我使用 Excel 发送文本并使用 ";" 作为 Excel 中的分隔符时,它准确地给出了我需要的输出。

数据:

'Balance Sheet;"'Package / Number";"Package Type";"Instrument";"Counterparty";"Opening Date";"Value Date";"Maturity Date";"'Nominal Amount";"'Interest Rate";"CCy";"'Funding Type";"Nominal Amount Local";"Interest Rate Local";"'Maturity Year";"'Maturity Quarter";"Tenor";"Tenor Range";"Date Basis"
Asset Finance;"2.915.239";;"IRS-FIX-TO-FLOAT";"X_SEL";"03/27/2019";"03/29/2019";"08/29/2023";"-20.000.000.000";"1
Asset Finance;"2.915.239";;"IRS-FIX-TO-FLOAT";"X_SEL";"03/27/2019";"03/29/2019";"08/29/2023";"20.000.000.000";"2
Asset Finance;;;"IRS-FIX-TO-FLOAT";;"03/27/2019";"03/29/2019";"08/29/2023";;;;"Payer Swap";"20.000.000.000";"-1

代码:

df = pd.read_csv(path2, sep='";"',engine='python')

df = df.apply(lambda x: x.replace('"','')) --\> doesnt seems to be working

输出列未正确拆分。应该按照上面的栏目0:资产负债表,1:包裹/数量,2:'包裹类型等。共19栏

熊猫输出:

如果有任何其他解决方案,请告诉。谢谢!

【问题讨论】:

  • 如果您在文本编辑器中仔细查看 CSV 文件,您会发现并非所有列/值都由 ";" 分隔。

标签: pandas dataframe csv separator


【解决方案1】:

仅使用 sep=";"正确拆分列。添加 quotechar='"' 以告诉熊猫 " 是引号字符,不应成为值的一部分。

df = pd.read_csv(path2,sep=';', quotechar='"',engine='python')

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2022-10-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多