【问题标题】:Writing multiple files from one pandas dataframe从一个 pandas 数据帧写入多个文件
【发布时间】:2023-03-22 09:31:01
【问题描述】:

我有一个 CSV 文件,我正在尝试将其提取并分解为多个部分。它有 10 列。我当前的脚本(其中一行如下所示)要求用户输入两列(例如列 A 和 C)并从第三列(列 F)获取数据并将列 A 和 F 写入新的 CSV 文件。

df1 = data.columnF[(data['columnA'] == data_name) & (data['columnC'] == study_name)]

当前输出如下所示:

name1,study1
name1,study2
name1,study2
name5,study9
name6,study6
name6,study0

相反,我希望输出是多个文本文件(通过跳过将所有内容写入 CSV 文件然后将其分成块的步骤)。

File 'name1.txt' should have
study1
study2 (only once, without repetition) 

同样,

name5.txt > study9
name6.txt > study6
            study0

我该怎么做?

【问题讨论】:

    标签: python python-2.7 csv pandas dataframe


    【解决方案1】:

    使用groupby 并在每个组中循环:

    df_grouped = data.columnF[(data['columnA'] == data_name) & (data['columnC'] == study_name)].drop_duplicates().groupby('columnA')
    for index, group in df_grouped:
        group.to_csv(index + '.text')
    

    【讨论】:

      猜你喜欢
      • 2021-09-06
      • 1970-01-01
      • 1970-01-01
      • 2019-01-16
      • 1970-01-01
      • 2017-07-22
      • 2015-05-31
      • 1970-01-01
      • 2019-05-31
      相关资源
      最近更新 更多