【发布时间】:2020-04-23 15:50:41
【问题描述】:
我有纵向面板数据集,其中包含有关某人在某年居住的地方、他的职业以及指示此人是否搬家的虚拟变量的信息。
现在我正在尝试在 ggplot 中创建一个折线图,以可视化这些移动如何随时间波动。我想计算每年移动的比例。但是,我不确定如何按年份对所有个人进行分组,并且还包括指示某人是否搬家的假人。另外,我想看看这些移动波动在不同职业之间有何不同。
数据集如下所示:
df <- tibble(id = rep(1:5, each = 5),
year = rep(2010:2014, 5),
moved = c(1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 0, 1, 1, 0, 1, 1, 0, 1),
occupation = c('carpenter','carpenter', 'carpenter', 'carpenter', 'carpenter', 'cleaner',
'cleaner', 'cleaner', 'cleaner', 'cleaner', 'mechanic', 'mechanic',
'mechanic', 'mechanic', 'mechanic', 'carpenter', 'carpenter', 'carpenter',
'carpenter', 'carpenter', 'cleaner', 'mechanic', 'carpenter', 'cleaner',
'cleaner'))
不胜感激!
【问题讨论】: