【问题标题】:Error tokenizing data. C error Panda read xlsx file标记数据时出错。 C 错误 Pandas 读取 xlsx 文件
【发布时间】:2020-02-03 20:23:34
【问题描述】:

有些问题与我的标题相似,但没有一个回答我的问题。

我正在尝试读取具有以下格式的 xlsx 文件

但是我收到以下错误:`错误标记数据。 C 错误:第 4 行中应有 1 个字段,但看到了 3

我对读取数据第 1 节、第 2 节或第 3 节不感兴趣(但是我有很多这样的文件,所以我无法删除它们)。我只想读取数据 开始第 1 列、第 2 列、...第 17 列。 (假设删除前 40 行)这是我尝试过的:

data=pd.read_csv(Path)

我收到错误标记数据。 C 错误。

当我尝试使用 header= None 时,我也得到了同样的结果。 我尝试了以下操作:

data=pd.read_csv(Path,error_bad_lines=False)

标记数据时出错。 C 错误:捕获缓冲区溢出

我尝试了以下操作:

data=pd.read_csv(Path,names=[column1,column2,....column17])

我收到了这个错误

'utf-8' 编解码器无法解码位置上的字节 0xf2。

我不知道要使用什么编码,也不认为这是问题所在。我想跳过 xlsx 文件的前 40 行,似乎我无法将引擎更改为 python,它只能在默认引擎下工作。并正常读取数据。谁能帮我加载和读取这些数据? `

更新:删除第 1 节、第 2 节...后,我仍然收到标记错误。但是,删除上述部分会使某些列中的文件损坏,可能就是这种情况。

` 更新:可以使用 pd.read_excel(Path) 读取文件,原因是我无法使用 pd.read_csv 因为它提供了比 pd.read_excel 更多的选项?

【问题讨论】:

    标签: python pandas file csv xlsx


    【解决方案1】:

    你可以 df=Pd.read_excel(路径,skiprows=40) 您试图实现的目标是从 read_csv 读取 excel 文件,这就是它给出错误的原因。你可以使用它,它不会给出错误

    【讨论】:

      【解决方案2】:

      尝试使用,

      data = pd.read_csv(path, skiprows=40)
      

      这将跳过读取 .csv 文件中的前 40 行。

      【讨论】:

      • 这不起作用仍然给了我同样的错误。这显然是一个 xlsx 文件,所以它的编码也有问题
      猜你喜欢
      • 2018-03-31
      • 1970-01-01
      • 2016-03-04
      • 1970-01-01
      • 2018-06-01
      • 2021-07-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多