【发布时间】:2019-07-25 15:49:58
【问题描述】:
有以下数据集
data = {'Country': ['UK','Ireland', 'Ireland', 'South Africa','Botswana','Italy','Greece'],
'Sub_ISO': ['Europe', 'Europe', 'Europe', 'Southern Africa','Southern Africa','Europe', 'Europe'],
'Language': ['EN', 'EN', 'IR', 'EN', 'EN', 'ITA', 'GRE'],
'count': [170,170, 170, 65,64,53,150]}
df = pd.DataFrame(data=data)
我想做的是能够用一个唯一的 ID 号来识别那些在同一个 Sub_ISO 中并且说同一种语言的国家。抱歉,我不知道该怎么做,所以我真的不能提供更多的代码。
预期输出
****编辑
爱尔兰和其他有不止一种语言的国家重复
【问题讨论】:
-
输出应该是什么样子的?你也能发一下吗?谢谢
-
完成,任何不匹配的(不同的 Sub_ISO,不同的语言)都是 NaN