【问题标题】:Creating new dataframe from existing - SettingWithCopyWarning从现有数据框创建新数据框 - SettingWithCopyWarning
【发布时间】:2016-10-14 07:19:42
【问题描述】:

我有一个作为数据框导入的 csv 文件。该数据帧经过多个过滤步骤。数据也会根据条件在列之间移动。

import numpy as np
import pandas as pd

df = pd.read_csv('my_csv_file.csv', names=headers)
df2 = df.drop_duplicates(['Column_X'])
series1 = df2.loc[df2['Column_Y'] == 'Category1', 'Column_X']
df2.loc[df2['Column_Y'] == 'Category1', 'Column_Z'] = series1
...

在命令提示符中输入最后一行后,我得到了 SettingWithCopyWarning。

SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer, col_indexer] = value instead.

请注意,我在代码中使用了 .loc。

执行以下操作不会引发错误:

df.loc[df['Column_Y'] == 'Category1', 'Column_Z'] = series1

这让我觉得问题在于使用 df2 作为新的数据框。

【问题讨论】:

    标签: python pandas chained-assignment


    【解决方案1】:

    我认为问题在于df2df1 的视图。而是在.drop_duplicates 调用的末尾放置一个.copy()

    df2 = df.drop_duplicates(['Column_X']).copy()
    

    【讨论】:

      猜你喜欢
      • 2021-09-08
      • 1970-01-01
      • 2022-01-18
      • 2023-01-30
      • 1970-01-01
      • 2021-06-10
      • 1970-01-01
      相关资源
      最近更新 更多