【发布时间】:2014-05-05 15:20:36
【问题描述】:
我有一个数据集,其中每一行都是 公司,年份 对,firmid 是一个字符串。
如果我这样做了
duplicates drop firmid year, force
它不会删除任何内容,因为没有重复项(我最初在运行 duplicates drop firmid year, force 后创建了数据集)。
到目前为止一切顺利。我想创建一个面板,它需要一个数字的firmid。所以我跑了
egen newid = group(firmid)
xtset newid year
但弹出“面板中的重复时间值”错误。此外,
duplicates list newid year
列出一大堆重复项。
似乎egen, group() 没有生成唯一组。我的问题是:为什么以及如何以稳健的方式创建独特的组?
【问题讨论】:
-
您能否发布一个可重现的示例?例如,具有最小数据输入的完整违规代码会重现问题。请参阅
help input在 do 文件中创建简短的示例数据。 -
你能显示重复的
firmid吗?当有重复时,查看所有三个变量会很方便。 -
要考虑的另一种方法是
encode,请参阅help。
标签: stata panel-data