【发布时间】:2017-03-02 11:26:03
【问题描述】:
从从csv 文件加载的初始 DataFrame,
df = pd.read_csv("file.csv",sep=";")
我得到一个过滤副本
df_filtered = df[df["filter_col_name"]== value]
但是,当使用diff() 方法创建新列时,
df_filtered["diff"] = df_filtered["feature"].diff()
我收到以下警告:
/usr/local/bin/ipython3:1: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead
See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
#!/usr/bin/python3
我还注意到处理时间很长。
令人惊讶的是(至少对我来说......),如果我在未过滤的 DataFrame 上做同样的事情,我运行良好。
我应该如何继续在过滤后的数据上创建一个“差异”列?
【问题讨论】:
标签: python pandas data-science