【发布时间】:2013-06-09 07:29:51
【问题描述】:
我的数据集中的一些观察需要分成两个或三个不同的观察。例如以下观察:
region income gdp other
North 120 450 50
我需要将它分成三个观察值,对于所有变量相同的值,除了这样的区域:
region income gdp other
IL 120 450 50
MI 120 450 50
IN 120 450 50
我需要类似的东西:
if (region == "North") {
//create three new observations and delete the old one
}
Stata 可以吗?
【问题讨论】:
-
在应用之前,您的完整
region变量存储在哪里?如果它在一个数据集中,只需展开所有变量并在行号上合并两个数据集。 -
@Fr.谢谢您的回复。它在数据集中。我不确定“合并两个数据集”是什么意思。并非所有观察都需要重复。只有那些在
region变量中具有值“North”的人应该被复制,并且必须为IL, MI, IN更改值“North”...我不确定如何合并...你能详细说明一下吗? -
您是否有一个数据集包含一个变量持有区域和另一个持有状态?如果是这样,请根据需要扩展主数据,对它们进行相同的排序并使用
_n上的区域/州数据集进行合并。如果您在某处提供数据提取,也许会更容易向您展示它是如何工作的。 -
@Fr.当然,这是我的 .dta dl.dropboxusercontent.com/u/41007907/data.dta
-
您的数据集未指定应将哪个区域分配给哪个州。您需要提供您想要获得的对应关系的列表。你真正想要得到什么对我来说仍然是个谜,抱歉。
标签: duplicates stata