组织 csv。 Python中的文件数据答案

【问题标题】：Organising csv. file data in Python组织 csv。 Python中的文件数据
【发布时间】：2020-04-29 23:36:35
【问题描述】：

我是 Python 的初学者，但我有一个与编程相关的项目要处理，所以，我真的很想寻求帮助。我没有找到很多简单的解决方案来组织数据，以便我可以用它进行一些分析。首先，我有多个 csv 文件，我将它们作为 DataFrame 对象读入。最后，我需要将它们全部一起分析（现在文件被分离到 DataFrames 列表中，但稍后我可能需要将它们作为一个 DataFrame 对象）。但是，我在组织和分离数据方面遇到了问题。这些是一列中的数千行，其中显示了一部分：

                                            CIP;Date;Hour;Cons;REAL/ESTIMATED
EN025140855608477018TC2L;11/03/2020;1;0                                 057;R
EN025140855608477018TC2L;11/03/2020;2;0                                 078;R
EN025140855608477018TC2L;11/03/2020;3;0                                 033;R
EN025140855608477018TC2L;11/03/2020;4;0                                 085;R
EN025140855608477018TC2L;11/03/2020;5;0                                 019;R
                                                                    ...
EN025140855608477018TC2L;11/04/2020;20;0                                786;R
EN025140855608477018TC2L;11/04/2020;21;0                                288;R
EN025140855608477018TC2L;11/04/2020;22;0                                198;R
EN025140855608477018TC2L;11/04/2020;23;0                                728;R
EN025140855608477018TC2L;11/04/2020;24;0                                275;R

区域，中间的巨大空间，数字应该合并在一起，例如0.057，其中信息代表“Cons”（其实是最重要的信息）。我应该能够将数据分成 5 列以便继续分析。但是，它应该是不同 csv 文件的通用工具，而无需知道包含符号。但是内容和标题的结构总是一样的。

如果有人知道推荐一种处理此类数据的方法，我会很高兴。

【问题讨论】：

标签： pandas csv dataframe python-3.7 data-analysis

【解决方案1】：

听起来你想要做的是转换Cons 列，使空格变成一个点。

df = pd.read_csv("file.txt", sep=";")
df['Cons'] = df['Cons'].str.replace("\s+",".")
df['Cons'].head()

输出：

【讨论】：