【发布时间】:2020-12-16 19:59:57
【问题描述】:
假设我有一个由行业类型以及开始和结束日期组成的 data.frame(例如,对于员工)。
mydf <- data.frame(industry = c("Government", "Education", "Military", "Private Sector", "Government", "Private Sector"),
start_date = c("2014-01-01", "2016-02-01", "2012-11-01", "2013-03-01", "2012-12-01", "2011-12-01"),
end_date = c("2020-12-01", "2016-10-01", "2014-01-01", "2016-10-01", "2015-10-01", "2014-09-01"))
> mydf
industry start_date end_date
1 Government 2014-01-01 2020-12-01
2 Education 2016-02-01 2016-10-01
3 Military 2012-11-01 2014-01-01
4 Private Sector 2013-03-01 2016-10-01
5 Government 2012-12-01 2015-10-01
6 Private Sector 2011-12-01 2014-09-01
我想创建一个堆叠的 ggplot 条形图,其中 start_date 列中的每个唯一年份都在 X 轴上(例如 2011-2016),y 轴表示观察总数(行数) 代表该年的特定行业。
我不确定操作 data.frame 的正确方法是什么。大概我需要操纵数据以具有industryyear 和count 的列。但我不确定如何从日期范围生成年份列。有什么想法吗?
【问题讨论】: