【发布时间】:2015-07-10 21:57:06
【问题描述】:
我的问题与此处发布的问题非常相似。我正在尝试使用重塑数据将 CRSP 数据从长格式转换为宽格式。我将标准普尔公司的股票代码堆叠在一列中,而我想将它们设为列。在我的数据框中,我有三列:“DATE”、“TICKER”和“PRC”。 (中国是价格)。 相反,我希望列数等于我的唯一代码。我用:
dcast(df, DATE~TICKER, value.var="PRC"), fun.aggregate=length, fill=NaN, drop=FALSE)
这将返回完美的数据框,对左侧的时间序列日期和右侧的代码进行排序,但就像我链接到的问题一样,我将 1 和 NaN 作为我的值。我喜欢 NaN,但我希望将 1 替换为我的证券(即 PRC)的价格。
我得到 1 和 0 是因为一些股票代码缺少数据,这是有道理的,因为一些股票进出标准普尔 500 指数。我只是不知道为什么 value.var 命令被公然忽略。
【问题讨论】:
-
你能发布一个示例数据集吗?