【问题标题】:Getting Error tokenizing data while reading multiple csv files读取多个 csv 文件时出现错误标记数据
【发布时间】:2019-11-28 06:54:31
【问题描述】:

我有大量的 csv,想将它们合并到单个 df 中

tmp = [] 

for file in directory_liste:
    df_x = pd.read_csv(file,sep=';')
    tmp.append(df_x)

df = pd.concat(tmp) 

我收到此解析器错误ParserError: Error tokenizing data. C error: Expected 5 fields in line 119, saw 6

当我尝试只读取一个文件 df = pd.read_csv(file,sep=';') 时,我没有收到任何错误

可能有一些不同格式的文件吗?我怎样才能找到他们

"VarName" ; "TimeString"; "VarValue","Validity ", "Time_ms"这是我在excel中打开文件时的格式。

【问题讨论】:

  • 从错误中,您的一行似乎有五个以上的字段。
  • 在所有文件中还是在某些文件中?
  • 记录文件名以查看失败的文件

标签: python-3.x pandas csv dataframe


【解决方案1】:

我找到了导致错误的文件

tmp = [] 

for file in directory_liste:
    try:
        df_x = pd.read_csv(file,sep=';')
        tmp.append(df_x)
    except pd.errors.ParserError:
        print(file)

【讨论】:

    猜你喜欢
    • 2018-06-01
    • 2021-07-25
    • 1970-01-01
    • 2020-02-03
    • 2012-01-30
    • 2022-11-03
    • 1970-01-01
    • 1970-01-01
    • 2015-08-10
    相关资源
    最近更新 更多