【问题标题】:How to append dataframe column name in the list?如何在列表中附加数据框列名?
【发布时间】:2022-08-16 23:58:49
【问题描述】:

我是熊猫新手。 所以我尝试在相关性大于零的列表中附加列名。

这是我的代码

corr_matrix = df_train.corr()
corr_matrix[\"failure\"].sort_values(ascending=False)

useful_features = []
for f in corr_matrix[\"failure\"]:
    if f > 0:
        useful_features.append(df_train.columns)
print(useful_features)

但这是将所有列名附加到列表中

[Index([\'id\', \'product_code\', \'loading\', \'attribute_0\', \'attribute_1\',
       \'attribute_2\', \'attribute_3\', \'measurement_0\', \'measurement_1\',
       \'measurement_2\', \'measurement_3\', \'measurement_4\', \'measurement_5\',
       \'measurement_6\', \'measurement_7\', \'measurement_8\', \'measurement_9\',
       \'measurement_10\', \'measurement_11\', \'measurement_12\', \'measurement_13\',
       \'measurement_14\', \'measurement_15\', \'measurement_16\', \'measurement_17\',
       \'failure\', \'kfold\'],
.
.
.
I am not pasting complete output

我想要的是

useful_features = [\'failure\',\'loading\',...,\'kfold\']

的输出 corr_matrix[\"失败\"].sort_values(ascending=False)

failure           1.000000
loading           0.129089
measurement_17    0.033905
measurement_5     0.018079
measurement_8     0.017119
measurement_7     0.016787
measurement_2     0.015808
measurement_6     0.014791
measurement_0     0.009646
attribute_2       0.006337
measurement_14    0.006211
measurement_12    0.004398
measurement_3     0.003577
measurement_16    0.002237
kfold             0.000130
measurement_10   -0.001515
measurement_13   -0.001831
measurement_15   -0.003544
measurement_9    -0.003587
measurement_11   -0.004801
id               -0.007545
measurement_4    -0.010488
measurement_1    -0.010810
attribute_3      -0.019222
Name: failure, dtype: float64

有没有办法附加列名? df_train.columns.values 还附加列表中的所有名称

    标签: python pandas


    【解决方案1】:

    您可以使用索引来执行此操作:

    print(
        corr_matrix.index[corr_matrix["failure"] > 0]
    )
    

    这转化为

    1. 从 corr 矩阵中获取index
    2. 评估"failure" 列何时为> 0
    3. 使用上述评估过滤index

    【讨论】:

      猜你喜欢
      • 2022-01-17
      • 2021-05-01
      • 1970-01-01
      • 2021-07-07
      • 2019-09-08
      • 2021-02-06
      • 1970-01-01
      • 2019-09-09
      • 2019-08-27
      相关资源
      最近更新 更多