【问题标题】:Normalize data with R使用 R 规范化数据
【发布时间】:2014-07-07 08:09:43
【问题描述】:

我有一个名为 data 的数据框,其中包含 5 列和大约 181 行。

我正在尝试在此数据帧上运行一些算法,但我必须事先进行一些预处理并将列标准化为具有 0 和 1。 我正在使用 R,但问题是我的列没有像这样的数字数据:

Name       ZwaveType ProprietesName Value                Date
Switcher19         0              2     1 2014-03-01 06:45:00
Switcher5          0              2     1 2014-03-01 07:00:00
Switcher15         0              2     1 2014-03-01 07:15:00
Switcher4          0              2     1 2014-03-01 07:14:30
Switcher15         0              2     0 2014-03-01 07:25:00
Switcher19         0              2     0 2014-03-01 07:45:00

我想问一下在这种情况下如何使用 R 实现标准化?

【问题讨论】:

  • 规范化是什么意思?你想如何规范化你的数据?
  • 为什么要规范化文本和数据字段,ProprietesNameName
  • 我想根据列值和 Dtae 生成新列来规范化数据,以区分值为 1 和值为 0 的数据

标签: r som


【解决方案1】:

大概是这样的

col.classes <- sapply(mydata,class)
num.cols <- (col.classes=="numeric")
mydata[,num.cols] <- scale(mydata[,num.cols])

【讨论】:

  • 我该如何使用这个功能?你所说的“类”是什么意思,它是包类吗?
  • 这是一个完整的字面答案:它假定 mydata 是您的数据集。 class 是基础 R 中的一个函数——参见 ?class
  • 我想我可能误解了你的问题。
  • 我的问题是关于如何使用这个函数,我的数据不是数字,我已经使用了函数 normalize : normalize(dataset, byrow=TRUE) 并且我有这个错误 Erreur dans colMeans(x, na .rm = TRUE) : 'x' doit être numérique
  • 我想到了一个想法,以便规范化我的数据框中的数据。事实上,我可以忽略 Name 列并将其替换为列 ID(这已经是数字),所以我仍然拥有的唯一非数字列是 Date,所以我考虑浏览我的数据框,我将生成一个新列每个日期。当我关联一个值时,在相似的日期我将关联相同的值,但直到现在我才知道是否可以用 R 做这项业务??
猜你喜欢
  • 2023-03-26
  • 2017-06-06
  • 2020-07-09
  • 2015-03-03
  • 2014-12-23
  • 2018-09-20
  • 2016-12-06
  • 2011-02-21
相关资源
最近更新 更多