【问题标题】:Pandas Read Excel with skip merged cells带有跳过合并单元格的 Pandas 读取 Excel
【发布时间】:2018-12-28 20:33:11
【问题描述】:

我正在尝试使用 pandas 库读取 xlsx 文件。我想跳过行直到第 11 行然后开始阅读,我尝试了 pandas 的 skiprows 选项,但它似乎不起作用并返回错误xlrd.biffh.XLRDError: ZIP file contents not a known type of workbook

我无法弄清楚这里的 wrog 是什么。这是我尝试过的代码。从 B1:E1、B2:E2 等到 B10:E10 行的行是合并行。

read_conversion_raw_file = pd.read_excel("test.xlsx", skiprows=10)

【问题讨论】:

  • @meW 仍然遇到同样的错误。
  • skiprows = range(10) 应该可以工作
  • @meW 我在询问这适用于列中相关错误的问题之前进行了研究,我的担忧与此无关,但是,该错误与您所指的堆栈问题相同。
  • 你能把文件上传到共享路径(比如谷歌驱动器)上,我可以从那里测试它。

标签: pandas


【解决方案1】:

我尝试使用test.xlsxtest.csv 读取此文件,但在这两种情况下都会出错。 因此,一种可能的解决方案是将此test.xlsx 转换为文本文件test.txt,然后像这样跳过前 10 行来读取它,

df = pd.read_csv('test.txt', sep=",", skiprows = range(10))

输出:

      Campaign                                        Site (DCM)    Placement   Date    Activity    Advertiser  Advertiser ID   Total Conversions
0   002|2018|Q1|Accounting|Accounting|LON|UK_ACGRC_ affectv.co.uk   PKMG3Y_Sage|Payroll|Sage One |UK|Display|Looka...   2018-11-28  Non-Conversion FL   Sage|UK 8205616 1
1   002|2018|Q2|Accounting|LON|UK_ACGRC_    facebook UK SAGE|Accounting|Sage_One|UK|Social|Intrests|Fa...   2018-11-28  Accounting|FY17|Q4|LP|brochure  Sage|UK 8205616 2
2   002|2018|Q2|Accounting|LON|UK_ACGRC_    facebook UK SAGE|Accounting|Sage_One|UK|Social|Intrests|Fa...   2018-11-28  HR&Payroll|FY18|Q4|LP|BOFURetargeting   Sage|UK 8205616 1
3   002|2018|Q2|Accounting|LON|UK_ACGRC_    facebook UK Sage|Accounting|SageOne|UK|Social|WebsiteRTG|F...   2018-11-12  Non-Conversion FL   Sage|UK 8205616 2
4   002|2018|Q2|CoreFinancials|LON|UK_CRFG_ facebook UK SAGE|Core Financials|Sage Live|UK|Social|Looka...   2018-11-14  Non-Conversion FL   Sage|UK 8205616 2

由于空间原因,输出格式有点混乱,但希望它能满足您的问题要求。

【讨论】:

  • 它不像我说的那样工作,单元格从第 1 行合并到第 10 行的 B:E
  • 你能上传你的数据集文件吗?
  • @MonikaRai 我已经更新了回复。请看一下。感谢您的耐心等待。
  • 我相信这不是我正在寻找的永久解决方案。
猜你喜欢
  • 2014-05-21
  • 2021-11-21
  • 2018-05-29
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-04-18
  • 1970-01-01
相关资源
最近更新 更多