【问题标题】:Pandas Try using .loc[row_indexer,col_indexer] = value instead熊猫尝试改用 .loc[row_indexer,col_indexer] = value
【发布时间】:2018-12-22 23:14:46
【问题描述】:

这是我的例子

data = {'Team': ['Riders', 'Riders', 'Devils', 'Devils', 'Kings',
         'kings', 'Kings', 'Kings', 'Riders', 'Royals', 'Royals', 'Riders'],
         'Rank': [1, 2, 2, 3, 3,4 ,1 ,1,2 , 4,1,2],
         'Year': [2014,2015,2014,2015,2014,2015,2016,2017,2016,2014,2015,2017],
         'Points':[876,789,863,673,741,812,756,788,694,701,804,690]}
data = pd.DataFrame(data)
data.head()

当我这样做时,我从 pandas 库收到警告

from sklearn.model_selection import train_test_split
train_new, val_new = train_test_split(data, test_size=0.2)

col = 'Team'
means = data.groupby(col)['Points'].mean()
train_new[col + '_mean_target'] = train_new[col].map(means)
train_new.head()

这是警告

SettingWithCopyWarning: 试图在 DataFrame 中的切片副本上设置一个值。 尝试改用 .loc[row_indexer,col_indexer] = value

当我使用 .loc 时

col = 'Team'
means = data.groupby(col)['Points'].mean()
train_new.loc[:,col + '_mean_target'] = train_new.loc[:,col].map(means)
train_new.head()

它显示了完全相同的警告,那么代码有什么问题?

【问题讨论】:

  • 我很困惑,您发布的数据没有对齐。它甚至在语法上都不正确。什么意思?
  • 语法上是正确的,但也许我应该发布一个更小的例子。
  • 我发誓我在使用几乎与您完全相同的代码之前遇到了这个问题,所以我通常只是忽略它。我目前正在寻找解决方案,因为我厌倦了看到它。如果我发现任何有用的东西,我会报告。

标签: python pandas warnings


【解决方案1】:

另一种方法是禁用链式分配,它适用于您的代码无需创建副本:

# disable chained assignments
pd.options.mode.chained_assignment = None

这是这个相关问题的答案(不会说这是一个重复的问题)-Pandas DataFrame: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame

【讨论】:

    猜你喜欢
    • 2018-10-06
    • 2022-11-29
    • 1970-01-01
    • 2021-11-30
    • 2017-11-28
    • 1970-01-01
    • 2023-03-11
    • 2016-07-03
    相关资源
    最近更新 更多