【发布时间】:2021-09-13 00:38:29
【问题描述】:
我对 R 比较陌生 - 我在弄清楚如何缩放包含字符变量的数据集时遇到了挑战。
但是,当我尝试使用 scale 函数创建数据框时,出现错误:
df<-scale(USArrests)
Error in colMeans(x, na.rm = TRUE) : 'x' must be numeric
有没有办法创建一个带有字符变量的数据框,以便以后在聚类分析中使用它?
km.res<-kmeans(df,4,nstart=10)
【问题讨论】:
-
请不要发布代码/数据/错误的图像:它会破坏屏幕阅读器并且无法复制或搜索(参考:meta.stackoverflow.com/a/285557 和 xkcd.com/2116)。请直接包含代码、控制台输出或数据(例如,
data.frame(...)或来自dput(head(x))的输出)。 -
(我说在对
datasets包中的数据尝试了scale(USArrests)之后,我没有收到错误消息。也许您之前可能已经为“清理”或“groom”USArrests损坏了其中的某些内容。如果您将行名作为列引入,那么可能是scale(USArrests[,-1])?) -
我意识到我的第一条评论(关于图片)可能有点过早/苛刻,因为
USArrests来自datasets包。 -
谢谢@r2evans,我会记住这一点。我已经删除了图像。哦,好吧,谢谢,是的,我看到它是在实际修改数据时。用原始文件替换数据集 100% 有效。感谢您的帮助!
标签: r dataframe cluster-analysis scale