【问题标题】:lm in R - seemingly categorical values for continued value predictors [duplicate]R中的lm-连续值预测器的看似分类值[重复]
【发布时间】:2016-12-13 18:42:45
【问题描述】:

我是R 的新手,对lm() 函数有疑问。我有一列Ratings,它是0到5范围内的连续属性。当我调用lm()命令时:

lm(some_overall_rating ~ Rating, data = Ratings)

我得到如下输出:

我的问题是为什么我有这么多的系数?理想情况下,我正在为ratings$rating 列寻找一个系数。

【问题讨论】:

  • 请参阅R 帮助页面以获取factor
  • 在您的rooms_rating 列中,您有一个字符NULL。导入数据时,该列将转换为 factor。您将(可能)希望将NULLs 转换为NAs(缺失值),然后转换为数字。
  • 有点困惑为什么你有Rating作为你的回归量,但输出结果却是ratings$rooms_rating2ratings$rooms_rating3等。不应该是Rating2Rating3Rating4,等等?你确定这是你的代码lm(some_overall_rating ~ Rating, data = Ratings)的输出吗?

标签: r regression lm


【解决方案1】:

您的评分被视为factor 变量。如果你跑

class(ratings$rooms_rating)

它将返回factor。要转换为数值变量,请尝试以下操作(取决于 dplyrreadr 包)。

ratings = ratings %>%
    mutate(rooms_rating = parse_number(rooms_rating))

现在,重新运行您的模型。

【讨论】:

  • 请注意lm 输出中的NULL。他们可能必须首先得到处理。
猜你喜欢
  • 2021-03-23
  • 1970-01-01
  • 2016-03-15
  • 1970-01-01
  • 2021-11-20
  • 1970-01-01
  • 1970-01-01
  • 2017-09-04
  • 2021-08-26
相关资源
最近更新 更多