【发布时间】:2020-10-26 23:59:59
【问题描述】:
我有一个看起来像这样的调查数据集。 “年”、“月”和“日期”列记录了进行采访的日期,数据截至 2018 年 12 月 30 日:
| Year | Month | Date | USDollar |Governate|
|------|-------|------|----------|---------|
| 2018 | 6 | 10 | 38.50 | 11 |
| 2018 | 6 | 12 | 38.52 | 12 |
| 2018 | 6 | 14 | 38.61 | 10 |
| 2018 | 6 | 18 | 38.63 | 12 |
| 2018 | 6 | 21 | 38.63 | 13 |
| 2018 | 7 | 22 | 38.65 | 12 |
| 2018 | 7 | 23 | 39.41 | 13 |
| 2018 | 7 | 24 | 39.42 | 15 |
| 2018 | 7 | 02 | 39.43 | 12 |
| 2018 | 7 | 03 | 39.50 | 13 |
等等。我想要做的是创建一个虚拟变量,如果日期在 10 月 7 日之后,则为 1,如果日期在 10 月 7 日之前,则为 0。我想将此变量称为“post_float”。
我尝试使用此命令 df$post_float <- ifelse(df$month >= 10 & df$date >= 7, 1, 0) 但这并没有完全做到。在大多数情况下没关系,但它会弄乱一些日期(例如,11 月 5 日,因为这不符合命令要求)。如何设置虚拟对象,使其在 10 月 7 日变为 1 并保持这种状态直到数据集结束?
感谢您的帮助,如果我遗漏了任何明显的内容,我很抱歉,我是 R 新手。
【问题讨论】:
-
你的数据集在哪里结束,它涵盖了多少年?
标签: r dataframe dataset survey dummy-variable