标记数据时出错。 C 错误 Pandas 读取 xlsx 文件答案

【问题标题】：Error tokenizing data. C error Panda read xlsx file标记数据时出错。 C 错误 Pandas 读取 xlsx 文件
【发布时间】：2020-02-03 20:23:34
【问题描述】：

有些问题与我的标题相似，但没有一个回答我的问题。

我正在尝试读取具有以下格式的 xlsx 文件

但是我收到以下错误：`错误标记数据。 C 错误：第 4 行中应有 1 个字段，但看到了 3

我对读取数据第 1 节、第 2 节或第 3 节不感兴趣（但是我有很多这样的文件，所以我无法删除它们）。我只想读取数据开始第 1 列、第 2 列、...第 17 列。（假设删除前 40 行）这是我尝试过的：

data=pd.read_csv(Path)

我收到错误标记数据。 C 错误。

当我尝试使用 header= None 时，我也得到了同样的结果。我尝试了以下操作：

data=pd.read_csv(Path,error_bad_lines=False)

标记数据时出错。 C 错误：捕获缓冲区溢出

我尝试了以下操作：

data=pd.read_csv(Path,names=[column1,column2,....column17])

我收到了这个错误

'utf-8' 编解码器无法解码位置上的字节 0xf2。

我不知道要使用什么编码，也不认为这是问题所在。我想跳过 xlsx 文件的前 40 行，似乎我无法将引擎更改为 python，它只能在默认引擎下工作。并正常读取数据。谁能帮我加载和读取这些数据？ `

更新：删除第 1 节、第 2 节...后，我仍然收到标记错误。但是，删除上述部分会使某些列中的文件损坏，可能就是这种情况。

` 更新：可以使用 pd.read_excel(Path) 读取文件，原因是我无法使用 pd.read_csv 因为它提供了比 pd.read_excel 更多的选项？

【问题讨论】：

【解决方案1】：

你可以 df=Pd.read_excel（路径，skiprows=40）您试图实现的目标是从 read_csv 读取 excel 文件，这就是它给出错误的原因。你可以使用它，它不会给出错误

【讨论】：

【解决方案2】：

尝试使用，

data = pd.read_csv(path, skiprows=40)

这将跳过读取 .csv 文件中的前 40 行。

【讨论】：