【发布时间】:2012-09-16 13:53:24
【问题描述】:
我收到了一个相当大的 Excel 文件(5k 行),也是 CSV,我想将其制作成 pandas 多级 DataFame。该文件的结构如下:
SampleID OtherInfo Measurements Error Notes
sample1 stuff more stuff
36 6
26 7
37 8
sample2 newstuff lots of stuff
25 6
27 7
测量次数可变(有时为零)。任何信息之间都没有完整的空白行,并且“测量”和“错误”列在具有其他(字符串)数据的行上为空;这可能会使解析变得更加困难(?)。有没有一种简单的方法可以自动进行这种转换?我最初的想法是先用 Python 解析文件,然后在循环中将内容输入 DataFrame 插槽,但我不知道具体如何实现它,或者它是否是最好的做法。
提前致谢!
【问题讨论】:
标签: python excel csv dataframe pandas