【发布时间】:2014-10-27 23:38:53
【问题描述】:
我有一个数据框 df,其中包含一系列年份的许多字段名称。
field
year description
1993 bar0 a01arb92
bar1 a01svb92
bar2 a01fam92
bar3 a08
bar4 a01bea93
然后,对于每一年,我都有一个 stata 文件,其中包含 id 作为列和附加列,df 中提到的部分(或全部)字段名称。例如,1993.dta 可以是
id a01arb92 a01svb92 a08 a01bea93
0 1 1 1 1
0 1 1 1 2
我需要每年检查df 中列出的所有字段是否确实存在于相应文件中(作为列)。然后我想将结果保存回原始数据框中。有没有一种不用遍历每个字段的好方法?
预期输出:
field exists
year description
1993 bar0 a01arb92 1
bar1 a01svb92 1
bar2 a01fam92 0
bar3 a08 1
bar4 a01bea93 1
例如,如果除a01fam92 之外的每个字段都作为列存在于 1993 文件中。
【问题讨论】: