【发布时间】:2019-08-11 16:24:45
【问题描述】:
我想为双边贸易流数据帧(以from、to 和amount 交易格式编码)生成一组二元标识符,以便我可以使用这些标识符进行进一步的统计分析。
下面提供了我的示例数据,我从中提取并识别了涉及美国的数据中的独特国家对。
# load the example data
trade_flow <- readRDS(gzcon(url("https://www.dropbox.com/s/ep7xldoq9go4f0g/trade_flow.rds?dl=1")))
# extract country dyads
country_dyad <- trade_flow[, c("from", "to")]
# identify unique pairs
up <- country_dyad[!duplicated(t(apply(country_dyad, 1, sort))),]
# extract only unique pairs that involve the US
up <- up[(up$from == "USA") | (up$to == "USA"), ]
## how can I use the unique pair object (up) to generate dyad identifiers and include them as a new column in the trade_flow dataframe
下一步是将原始数据帧的 (trade_flow) from 和 to 列中的这些唯一 dyad 对匹配,并生成唯一 dyad 标识符列表作为新列(例如,dyad)到df (trade_flow)。它应该类似于下面的格式,其中每个唯一的二元组都被识别并编码为唯一的数值。如果有人可以帮助我,我将不胜感激。
from to trade_flow dyad
USA ITA 5100 2
USA UKG 4000 1
USA GMY 17000 3
USA ITA 4500 2
USA JPN 2900 4
USA UKG 6700 1
USA ROK 7000 5
USA UKG 2300 1
USA SAF 1500 6
IND USA 2400 7
【问题讨论】:
标签: r unique hierarchical-data pairwise