【问题标题】:Is there a way to edit columns in CSV file with python?有没有办法用 python 编辑 CSV 文件中的列?
【发布时间】:2020-08-13 17:00:42
【问题描述】:

我正在尝试对大型 CSV 文件中的数据进行标准化。我想用不同的字符串“Q35497”替换字符串“Greek”,但只在一个列中(我不想在每一列中将“Greek”这个词的每个实例都替换为“Q35497”,而只是在一个列中命名为“P407”)。这就是我目前所拥有的

data_frame = pd.read_csv('/data.csv') data_frame["P407"] = data_frame['P407'].astype(str) data_frame["P407"].str.replace('Greek', 'Q35497')

但这只是创建一个带有字符串列表的单列“P407”(例如“Q35497”),我无法将其附加到整个 csv 表中。

我尝试使用 DataFrame.replace

data_frame = data_frame.replace( #to_replace={"P407":{'Greek':'Q35497'}}, #inplace=True #)

但这只会创建一个空集。我也无法弄清楚为什么 data_frame["P407"] 创建了一个无法添加到原始 csv 文件中的单独系列。

【问题讨论】:

  • 我猜你只是错过了覆盖旧值:你能试试data_frame = pd.read_csv('/data.csv')data_frame["P407"]=data_frame["P407"].str.replace('Greek', 'Q35497')

标签: python python-3.x pandas csv


【解决方案1】:

您的方法是正确的,但您缺少存储修改后的数据帧。

data_frame = pd.read_csv('/data.csv')
data_frame["P407"] = data_frame["P407"].str.replace('Greek', 'Q35497')

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-03-26
    • 1970-01-01
    • 1970-01-01
    • 2012-08-20
    • 2020-04-29
    • 2021-08-03
    • 2020-02-27
    • 1970-01-01
    相关资源
    最近更新 更多