【发布时间】:2020-02-03 20:23:34
【问题描述】:
有些问题与我的标题相似,但没有一个回答我的问题。
但是我收到以下错误:`错误标记数据。 C 错误:第 4 行中应有 1 个字段,但看到了 3
我对读取数据第 1 节、第 2 节或第 3 节不感兴趣(但是我有很多这样的文件,所以我无法删除它们)。我只想读取数据 开始第 1 列、第 2 列、...第 17 列。 (假设删除前 40 行)这是我尝试过的:
data=pd.read_csv(Path)
我收到错误标记数据。 C 错误。
当我尝试使用 header= None 时,我也得到了同样的结果。 我尝试了以下操作:
data=pd.read_csv(Path,error_bad_lines=False)
标记数据时出错。 C 错误:捕获缓冲区溢出
我尝试了以下操作:
data=pd.read_csv(Path,names=[column1,column2,....column17])
我收到了这个错误
'utf-8' 编解码器无法解码位置上的字节 0xf2。
我不知道要使用什么编码,也不认为这是问题所在。我想跳过 xlsx 文件的前 40 行,似乎我无法将引擎更改为 python,它只能在默认引擎下工作。并正常读取数据。谁能帮我加载和读取这些数据? `
更新:删除第 1 节、第 2 节...后,我仍然收到标记错误。但是,删除上述部分会使某些列中的文件损坏,可能就是这种情况。
` 更新:可以使用 pd.read_excel(Path) 读取文件,原因是我无法使用 pd.read_csv 因为它提供了比 pd.read_excel 更多的选项?
【问题讨论】:
标签: python pandas file csv xlsx