【问题标题】:Pandas read_csv wrong separator recognitionPandas read_csv 错误分隔符识别
【发布时间】:2020-06-22 22:32:27
【问题描述】:

我正在尝试使用 read_csv 函数在 pandas 中打开 csv 文件。我的文件具有以下结构,一行带有标题,其中每个列标题的名称都有带引号下划线的名称,例如"header1";"header2";列中的非标题值包含不带引号的int或字符串值;分隔符。数据框具有以下结构 "header1";"header2";"header3"; value1;value2;value3; 当我申请 read_csv df = pd.read_csv("filepath", sep=";", engine="python") 我得到 ParseError: expected ';' after ' " ' 帮助解决它

【问题讨论】:

  • 您能否添加一个示例,说明 csv 文件中的非标题行是什么样的?
  • 花时间查看minimal reproducible example 将帮助您改进这个问题。 stackoverflow.com/help/how-to-ask 也一样
  • 非标题列包含带有 ; 的 int 或字符串值分隔符,例如狗;猫;等
  • 为了测试,包括quotechar参数ad change单引号:df = pd.read_csv('filepath', sep=';', engine='python', quotechar=' " ') ***不要在参数值中包含空格。我这样做是为了清楚。
  • 我做了同样的 ParseError: expected ';' '"'之后

标签: pandas


【解决方案1】:

尝试如下指定列名,看看能否解决问题:

col_names = ["header1", "header2", "header3"]
df = pd.read_csv(filepath, sep=";", names=col_names)

如果这不起作用,请尝试添加'quotechar=' " ' 并查看

【讨论】:

    猜你喜欢
    • 2018-01-08
    • 1970-01-01
    • 2017-10-25
    • 2017-05-05
    • 2017-07-06
    • 2017-06-25
    • 1970-01-01
    • 2015-09-20
    • 2020-12-30
    相关资源
    最近更新 更多