【问题标题】:Python Pandas Dynamically Read Excel Sheet with Multiple Header Rows of Different Column SizePython Pandas 动态读取具有不同列大小的多个标题行的 Excel 表
【发布时间】:2019-04-07 00:52:38
【问题描述】:

我有一个 Excel 表,我正试图将其作为数据框读入。工作表有多个标题行,每个标题行可以有不同数量的列。有些列是相似的,但并非总是如此。有没有办法可以将行拆分为单独的数据框?

例如数据是:

A B C D
1 1 1 1
2 2 2 2
A B C D E
1 1 1 1 1
2 2 2 2 2
3 3 3 3 3
A B C
1 1 1

理想的输出是三个单独的数据帧,它们各自的行和列标题。

【问题讨论】:

  • 你知道要分割的行数吗?

标签: python pandas


【解决方案1】:

.read_excel 具有 headerskiprowsskipfooter 参数,可以让您执行此操作,前提是您可以提前检测或知道每个标题所在的行。有了这些和usecols,您可以将工作表上的任何“窗口”定义为您的 df。然后可以像往常一样使用concatmergeappendjoin 来组合多个窗口。

【讨论】:

    猜你喜欢
    • 2017-03-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-11-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多