【发布时间】:2020-04-29 23:36:35
【问题描述】:
我是 Python 的初学者,但我有一个与编程相关的项目要处理,所以,我真的很想寻求帮助。我没有找到很多简单的解决方案来组织数据,以便我可以用它进行一些分析。 首先,我有多个 csv 文件,我将它们作为 DataFrame 对象读入。最后,我需要将它们全部一起分析(现在文件被分离到 DataFrames 列表中,但稍后我可能需要将它们作为一个 DataFrame 对象)。 但是,我在组织和分离数据方面遇到了问题。这些是一列中的数千行,其中显示了一部分:
CIP;Date;Hour;Cons;REAL/ESTIMATED
EN025140855608477018TC2L;11/03/2020;1;0 057;R
EN025140855608477018TC2L;11/03/2020;2;0 078;R
EN025140855608477018TC2L;11/03/2020;3;0 033;R
EN025140855608477018TC2L;11/03/2020;4;0 085;R
EN025140855608477018TC2L;11/03/2020;5;0 019;R
...
EN025140855608477018TC2L;11/04/2020;20;0 786;R
EN025140855608477018TC2L;11/04/2020;21;0 288;R
EN025140855608477018TC2L;11/04/2020;22;0 198;R
EN025140855608477018TC2L;11/04/2020;23;0 728;R
EN025140855608477018TC2L;11/04/2020;24;0 275;R
区域,中间的巨大空间,数字应该合并在一起,例如0.057,其中信息代表“Cons”(其实是最重要的信息)。
我应该能够将数据分成 5 列以便继续分析。但是,它应该是不同 csv 文件的通用工具,而无需知道包含符号。但是内容和标题的结构总是一样的。
如果有人知道推荐一种处理此类数据的方法,我会很高兴。
【问题讨论】:
标签: pandas csv dataframe python-3.7 data-analysis