R中的lm-连续值预测器的看似分类值[重复]答案

【问题标题】：lm in R - seemingly categorical values for continued value predictors [duplicate]R中的lm-连续值预测器的看似分类值[重复]
【发布时间】：2016-12-13 18:42:45
【问题描述】：

我是R 的新手，对lm() 函数有疑问。我有一列Ratings，它是0到5范围内的连续属性。当我调用lm()命令时：

lm(some_overall_rating ~ Rating, data = Ratings)

我得到如下输出：

我的问题是为什么我有这么多的系数？理想情况下，我正在为ratings$rating 列寻找一个系数。

【问题讨论】：

请参阅R 帮助页面以获取factor。
在您的rooms_rating 列中，您有一个字符NULL。导入数据时，该列将转换为 factor。您将（可能）希望将NULLs 转换为NAs（缺失值），然后转换为数字。
有点困惑为什么你有Rating作为你的回归量，但输出结果却是ratings$rooms_rating2、ratings$rooms_rating3等。不应该是Rating2、Rating3 ，Rating4，等等？你确定这是你的代码lm(some_overall_rating ~ Rating, data = Ratings)的输出吗？

标签： r regression lm

【解决方案1】：

您的评分被视为factor 变量。如果你跑

class(ratings$rooms_rating)

它将返回factor。要转换为数值变量，请尝试以下操作（取决于 dplyr 和 readr 包）。

ratings = ratings %>%
    mutate(rooms_rating = parse_number(rooms_rating))

现在，重新运行您的模型。

【讨论】：

请注意lm 输出中的NULL。他们可能必须首先得到处理。