【问题标题】:Feature-wise Normalization of Predictor Variables in RR中预测变量的特征归一化
【发布时间】:2020-04-16 11:46:26
【问题描述】:

所以我想稍后拟合一个神经网络来预测来自 ISLR 包的 College 数据集中的连续数值变量 Outstate 作为数据集中其他 17 个(预测变量)变量的函数。在拟合神经网络之前,我只需要对预测变量进行特征标准化。由于有 17 个预测变量,我不想明确输入我想要标准化的每个变量。在 R 中有没有可行的方法来做到这一点? scale 函数根据我的理解对数据集中的所有变量进行缩放。

library(ISLR)

set.seed(1)
College$Private = as.numeric(College$Private)
train.ind = sample(1:nrow(College),0.5*nrow(College))
college.train = College[train.ind,]
college.test = College[-train.ind,]

【问题讨论】:

    标签: r


    【解决方案1】:

    此代码将使用基本 R scale() 对每个特征进行标准化,该函数基于列均值对数据进行中心化,然后除以标准差,即 Z 分数标准化。

    preds = colnames(college.test)[-9]
    
    college.test[,preds] = lapply(college.test[,preds], scale)
    

    【讨论】:

    • 在您的示例中,如果我想进行 Z 分数标准化,那么简单地使用基本 R scale() 函数而不是使用我自己的函数是否行不通?
    • 是的,你是对的,我已经更新了我的答案。我误读了你的部分问题。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2019-01-24
    • 2013-02-20
    • 1970-01-01
    • 2023-03-10
    • 2021-05-22
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多