【问题标题】:Creating a dataframe from a csv file in pandas: column issue从 Pandas 中的 csv 文件创建数据框:列问题
【发布时间】:2019-03-24 17:45:42
【问题描述】:

我有一个凌乱的文本文件,我需要将其分类到数据框中的列中,所以我 可以做我需要做的数据分析。这是看起来凌乱的文件: Messy text

我可以将其作为 csv 文件读入,这样看起来会更好:

import pandas as pd

data = pd.read_csv('phx_30kV_indepth_0_0_outfile.txt')
print(data)

这会打印出对齐的数据,但问题是输出是 [640 行 x 1 列]。我需要将它分成多列并将其作为数据框进行操作。

我已经尝试了许多使用 StringIO 的解决方案,这些解决方案之前在这里都有效,但似乎没有任何效果。

但是,当我这样做时,有一个问题是

【问题讨论】:

  • 您可以通过阅读 read_csv 的文档来解决这个问题:pandas.pydata.org/pandas-docs/stable/generated/…sep=' ' 传递给 read_csv 方法可能会成功。
  • 我实际上已经检查了文档。我要做的是创建一个数据框,而不是 csv 文件,以便我可以操作数据。抱歉,图片不可读,这是我的第一个问题,堆栈不允许我上传实际图片。

标签: python pandas multiple-columns spyder


【解决方案1】:

delim_whitespace=True

文档链接 ^

df = pd.read_csv('phx_30kV_indepth_0_0_outfile.txt', delim_whitespace=True)

【讨论】:

    【解决方案2】:

    您的输入文件实际上不是 CSV 格式。

    由于你只提供了.png图片,甚至不清楚这个文件是否 是否分行。

    如果没有,您必须从将内容“切割”成单独的行开始,然后 从输出文件中读取内容 - 此切割的结果。

    我认为,这是第一步,在您可以使用read_csvread_table(当然,使用delim_whitespace=True)之前。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2020-01-24
      • 2016-12-21
      • 1970-01-01
      • 2016-04-29
      • 2020-01-29
      • 2020-12-24
      • 1970-01-01
      相关资源
      最近更新 更多