【问题标题】:Organising csv. file data in Python组织 csv。 Python中的文件数据
【发布时间】:2020-04-29 23:36:35
【问题描述】:

我是 Python 的初学者,但我有一个与编程相关的项目要处理,所以,我真的很想寻求帮助。我没有找到很多简单的解决方案来组织数据,以便我可以用它进行一些分析。 首先,我有多个 csv 文件,我将它们作为 DataFrame 对象读入。最后,我需要将它们全部一起分析(现在文件被分离到 DataFrames 列表中,但稍后我可能需要将它们作为一个 DataFrame 对象)。 但是,我在组织和分离数据方面遇到了问题。这些是一列中的数千行,其中显示了一部分:

                                            CIP;Date;Hour;Cons;REAL/ESTIMATED
EN025140855608477018TC2L;11/03/2020;1;0                                 057;R
EN025140855608477018TC2L;11/03/2020;2;0                                 078;R
EN025140855608477018TC2L;11/03/2020;3;0                                 033;R
EN025140855608477018TC2L;11/03/2020;4;0                                 085;R
EN025140855608477018TC2L;11/03/2020;5;0                                 019;R
                                                                    ...
EN025140855608477018TC2L;11/04/2020;20;0                                786;R
EN025140855608477018TC2L;11/04/2020;21;0                                288;R
EN025140855608477018TC2L;11/04/2020;22;0                                198;R
EN025140855608477018TC2L;11/04/2020;23;0                                728;R
EN025140855608477018TC2L;11/04/2020;24;0                                275;R

区域,中间的巨大空间,数字应该合并在一起,例如0.057,其中信息代表“Cons”(其实是最重要的信息)。 我应该能够将数据分成 5 列以便继续分析。但是,它应该是不同 csv 文件的通用工具,而无需知道包含符号。但是内容和标题的结构总是一样的。

如果有人知道推荐一种处理此类数据的方法,我会很高兴。

【问题讨论】:

    标签: pandas csv dataframe python-3.7 data-analysis


    【解决方案1】:

    听起来你想要做的是转换Cons 列,使空格变成一个点。

    df = pd.read_csv("file.txt", sep=";")
    df['Cons'] = df['Cons'].str.replace("\s+",".")
    df['Cons'].head()
    

    输出:

    0    0.057
    1    0.078
    2    0.033
    3    0.085
    4    0.019
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-09-25
      • 2019-04-21
      • 2012-11-26
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-06-21
      相关资源
      最近更新 更多