【发布时间】:2016-08-17 19:19:03
【问题描述】:
我正在尝试按年份和国家/地区合并两个数据集。第一个数据集 (df = GNIPC) 代表 1980-2008 年每个国家的人均国民总收入。
Country Year GNIpc
(chr) (dbl) (dbl)
1 Afghanistan 1990 NA
2 Afghanistan 1991 NA
3 Afghanistan 1992 2010
4 Afghanistan 1993 NA
5 Afghanistan 1994 12550
6 Afghanistan 1995 NA
第二个数据集(df = 制裁)代表从 1946 年至今实施的经济制裁。
country imposition sanctiontype sanctions_period
(chr) (dbl) (chr) (chr)
1 Afghanistan 1 1 6 8 1997-2001
2 Afghanistan 1 7 1979-1979
3 Afghanistan 1 4 7 1995-2002
4 Albania 1 2 8 2005-2005
5 Albania 1 7 2005-2006
6 Albania 1 8 2004-2005
我想合并这两个数据集,这样对于每个 GNI 年,我要么在该国实施制裁,要么不实施制裁。对于不在制裁期间的 GNI 年份,该值将为 0,而对于那些不在制裁期间的年份,该值为 1。这就是我希望它看起来的样子:
Country Year GNIpc Imposition sanctiontype
(chr) (dbl) (dbl) (dbl) (chr)
1 Afghanistan 1990 NA 0 NA
2 Afghanistan 1991 NA 0 NA
3 Afghanistan 1992 2010 0 NA
4 Afghanistan 1993 NA 0 NA
5 Afghanistan 1994 12550 0 NA
6 Afghanistan 1995 NA 1 4 7
【问题讨论】:
-
我不会使用该格式的第二个数据集。如果有人把数据交给我,我会(1)畏缩,(2)开始转换它,以便
sanctiontype和每年sanctions_period的每个组合都有一行。所以Afganistan将有五行与sanctiontype = 1,1997-2001 年每一行。 -
阿富汗 1998 年应该是什么样子?每个制裁期(2)是一行,还是
1 4 6 7 8一行? -
我做了一个不同的数据集,其中每种制裁类型都有自己的行。在这里,我正在寻找一种方法来确定每个 GNI 年份是否有制裁。回顾过去的制裁类型,我该怎么做?