【发布时间】:2018-09-22 22:33:11
【问题描述】:
我正在尝试为 R 创建一个虚拟变量。问题是我的餐厅“类型”数据集下有许多分类变量。其中,我希望素食餐厅的值为 1,其余为 0。因此,当我运行回归摘要时,我得到截距,b1 为 reviews_number,b2 为素食餐厅。例如,非素食餐厅为 y=b0+b1(reviews_number),素食餐厅为 y=b0+b1(reviews_number)+b2(Vegan)。提示是使用 ifelse() 命令,但我似乎无法将系数简化为 3。否则,我需要为每种类型的餐厅分别创建一个值......
【问题讨论】:
-
我觉得你有XY problem。也许您需要一个代表餐厅类型的因素。然后将 lm 与
y~reviews+type一起使用。