R中预测变量的特征归一化答案

【问题标题】：Feature-wise Normalization of Predictor Variables in RR中预测变量的特征归一化
【发布时间】：2020-04-16 11:46:26
【问题描述】：

所以我想稍后拟合一个神经网络来预测来自 ISLR 包的 College 数据集中的连续数值变量 Outstate 作为数据集中其他 17 个（预测变量）变量的函数。在拟合神经网络之前，我只需要对预测变量进行特征标准化。由于有 17 个预测变量，我不想明确输入我想要标准化的每个变量。在 R 中有没有可行的方法来做到这一点？ scale 函数根据我的理解对数据集中的所有变量进行缩放。

library(ISLR)

set.seed(1)
College$Private = as.numeric(College$Private)
train.ind = sample(1:nrow(College),0.5*nrow(College))
college.train = College[train.ind,]
college.test = College[-train.ind,]

【问题讨论】：

标签： r

【解决方案1】：

此代码将使用基本 R scale() 对每个特征进行标准化，该函数基于列均值对数据进行中心化，然后除以标准差，即 Z 分数标准化。

preds = colnames(college.test)[-9]

college.test[,preds] = lapply(college.test[,preds], scale)

【讨论】：

在您的示例中，如果我想进行 Z 分数标准化，那么简单地使用基本 R scale() 函数而不是使用我自己的函数是否行不通？
是的，你是对的，我已经更新了我的答案。我误读了你的部分问题。