带有跳过合并单元格的 Pandas 读取 Excel答案

【问题标题】：Pandas Read Excel with skip merged cells带有跳过合并单元格的 Pandas 读取 Excel
【发布时间】：2018-12-28 20:33:11
【问题描述】：

我正在尝试使用 pandas 库读取 xlsx 文件。我想跳过行直到第 11 行然后开始阅读，我尝试了 pandas 的 skiprows 选项，但它似乎不起作用并返回错误xlrd.biffh.XLRDError: ZIP file contents not a known type of workbook

我无法弄清楚这里的 wrog 是什么。这是我尝试过的代码。从 B1:E1、B2:E2 等到 B10:E10 行的行是合并行。

read_conversion_raw_file = pd.read_excel("test.xlsx", skiprows=10)

【问题讨论】：

@meW 仍然遇到同样的错误。
skiprows = range(10) 应该可以工作
@meW 我在询问这适用于列中相关错误的问题之前进行了研究，我的担忧与此无关，但是，该错误与您所指的堆栈问题相同。
你能把文件上传到共享路径（比如谷歌驱动器）上，我可以从那里测试它。
drive.google.com/open?id=1_rQqxcHdtDc4qQcyYyZ82n4-VdhKM91E 这是文件。

标签： pandas

【解决方案1】：

我尝试使用test.xlsx 和test.csv 读取此文件，但在这两种情况下都会出错。因此，一种可能的解决方案是将此test.xlsx 转换为文本文件test.txt，然后像这样跳过前 10 行来读取它，

df = pd.read_csv('test.txt', sep=",", skiprows = range(10))

输出：

      Campaign                                        Site (DCM)    Placement   Date    Activity    Advertiser  Advertiser ID   Total Conversions
0   002|2018|Q1|Accounting|Accounting|LON|UK_ACGRC_ affectv.co.uk   PKMG3Y_Sage|Payroll|Sage One |UK|Display|Looka...   2018-11-28  Non-Conversion FL   Sage|UK 8205616 1
1   002|2018|Q2|Accounting|LON|UK_ACGRC_    facebook UK SAGE|Accounting|Sage_One|UK|Social|Intrests|Fa...   2018-11-28  Accounting|FY17|Q4|LP|brochure  Sage|UK 8205616 2
2   002|2018|Q2|Accounting|LON|UK_ACGRC_    facebook UK SAGE|Accounting|Sage_One|UK|Social|Intrests|Fa...   2018-11-28  HR&Payroll|FY18|Q4|LP|BOFURetargeting   Sage|UK 8205616 1
3   002|2018|Q2|Accounting|LON|UK_ACGRC_    facebook UK Sage|Accounting|SageOne|UK|Social|WebsiteRTG|F...   2018-11-12  Non-Conversion FL   Sage|UK 8205616 2
4   002|2018|Q2|CoreFinancials|LON|UK_CRFG_ facebook UK SAGE|Core Financials|Sage Live|UK|Social|Looka...   2018-11-14  Non-Conversion FL   Sage|UK 8205616 2

由于空间原因，输出格式有点混乱，但希望它能满足您的问题要求。

【讨论】：

它不像我说的那样工作，单元格从第 1 行合并到第 10 行的 B:E
你能上传你的数据集文件吗？
drive.google.com/open?id=1_rQqxcHdtDc4qQcyYyZ82n4-VdhKM91E 这是文件
@MonikaRai 我已经更新了回复。请看一下。感谢您的耐心等待。
我相信这不是我正在寻找的永久解决方案。