【发布时间】:2021-04-23 06:36:48
【问题描述】:
我正在尝试根据以下数据计算失业率并将其作为新行添加到数据表中。我想根据日期将失业人数除以劳动力,并将每个数据点添加为一行。
基本上,我正在尝试摆脱这种情况
| date | series_1 | value |
|---|---|---|
| 2021-01-01 | labourforce | 13793 |
| 2021-02-01 | labourforce | 13812 |
| 2021-03-01 | labourforce | 13856 |
| 2021-01-01 | unemployed | 875 |
| 2021-02-01 | unemployed | 805 |
| 2021-03-01 | unemployed | 778 |
到这里
| date | series_1 | value |
|---|---|---|
| 2021-01-01 | labourforce | 13793 |
| 2021-02-01 | labourforce | 13812 |
| 2021-03-01 | labourforce | 13856 |
| 2021-01-01 | unemployed | 875 |
| 2021-02-01 | unemployed | 805 |
| 2021-03-01 | unemployed | 778 |
| 2021-01-01 | unemploymentrate | 6.3 |
| 2021-02-01 | unemploymentrate | 5.8 |
| 2021-03-01 | unemploymentrate | 5.6 |
到目前为止,这是我的代码。我知道最后一行是错的?欢迎任何建议或想法!
longdata %>%
group_by(date) %>%
summarise(series_1 = 'unemploymentrate',
value = series_1$unemployed/series_1$labourforce))
【问题讨论】:
-
看起来您可能会从更整洁的数据中受益。如果您的 data.frame 包含
date、labourforce和unemployed列,您可以轻松添加另一个名为unempleymentrate的列。完成此操作后,您仍然可以使用reshape2::melt()融化该 data.frame 以将其放入您发布的表单中