【问题标题】:Segmentation Fault working with a list of xts objects in R使用 R 中的 xts 对象列表的分段错误
【发布时间】:2011-08-09 22:55:45
【问题描述】:

我在处理 xts 对象列表时遇到问题。在列表元素上运行 lapply 时,我会遇到不同且奇怪的行为,有时还会出现程序段错误。我在 Ubuntu 9.10 上运行 R 2.12.2,尽管在 Windows XP 上运行 2.13.1 时遇到了类似的问题。

我正在尝试将包含季度财务数据的数据框拆分为多个时间序列。我在 CIK 代码上拆分数据帧,这是一个整数。数据框是:

> head(CQ[,c("datadate","fqtr","cik","ibq","mkvaltq","prccq","sic")])
    datadate fqtr    cik     ibq    mkvaltq prccq  sic
3 2009-12-31    1  61478   3.400  601.12800  6.21 3661
4 2010-03-31    2  61478 -13.000  709.07000  7.31 3661
5 2010-06-30    3  61478  75.900  718.77000  7.41 3661
6 2010-09-30    4  61478  10.900 1231.52400 12.67 3661
7 2004-03-31    3 319126   0.424    9.73455  1.05 3861
8 2004-06-30    4 319126   0.407   13.90650  1.50 3861
...

我用来创建 xts 对象列表的代码是:

CQT<-by(CQ[c("datadate","ibq","cik","mkvaltq","prccq","sic","fqtr")],CQ$cik,function(x)
  {
   xts(x,order.by=x$datadate,frequency=4)
  }
)
CQT<-as.list(CQT)

我不确定转换为列表是否绝对必要,但我觉得列表很舒服。

这将创建以下数据结构,我觉得它是正确的:

> head(CQT)
$`20`
           datadate     ibq     cik  mkvaltq     prccq      sic    fqtr
2004-03-31 "2004-03-31" "1.422" "20" " 53.75880" " 21.8000" "3823" "1" 
2004-06-30 "2004-06-30" "1.389" "20" " 55.04400" " 22.0000" "3823" "2" 
2004-09-30 "2004-09-30" "1.562" "20" " 55.69816" " 22.1200" "3823" "3" 
2004-12-31 "2004-12-31" "2.237" "20" " 67.11840" " 26.5500" "3823" "4" 
2005-03-31 "2005-03-31" "1.643" "20" " 77.28716" " 30.4400" "3823" "1" 
2005-06-30 "2005-06-30" "1.916" "20" " 75.12520" " 29.3000" "3823" "2" 
...

当我尝试在CQT 上运行lapply 时出现问题。在多次遇到问题后,我将测试代码压缩为:

lapply(CQT,function(x) {
  lag.xts(x[,"prccq"],1)
  }
)

我想如果我能做到这一点,那么我可能走在正确的轨道上。

此代码有时只会出现段错误。例如,在我运行的最近一次迭代中(为了发布),代码可以很好地通过许多记录。例如:

$`6494`
           prccq  
2004-03-31 NA     
2004-06-30 "0.240"
2004-09-30 "0.150"
2004-12-31 "0.090"
2005-03-31 "0.062"
...

但是,它会抛出:

$`6720`

Error in vector(storage.mode(x)) : 
vector: cannot make a vector of mode 'NULL'.

这并不总是错误:有时我会收到有关字符或其他内容的投诉,并且它从未在同一记录上停止过两次。此特定记录似乎没有任何问题:

> CQT$"6720"
           datadate     ibq        cik    mkvaltq    prccq   sic    fqtr
2004-03-31 "2004-03-31" "  10.740" "6720" "559.8638" "16.03" "3949" "1" 
2004-06-30 "2004-06-30" "   6.178" "6720" "558.6060" "15.70" "3949" "2" 
2004-09-30 "2004-09-30" "  13.198" "6720" "667.6474" "14.31" "3949" "3" 
2004-12-31 "2004-12-31" "   8.825" "6720" "743.1205" "15.88" "3949" "4" 
2005-03-31 "2005-03-31" "   2.324" "6720" "643.6650" "13.75" "3949" "1" 
2005-06-30 "2005-06-30" "   1.453" "6720" "594.0200" "12.68" "3949" "2" 
2005-09-30 "2005-09-30" "  16.740" "6720" "534.5802" "11.40" "3949" "3" 
2005-12-31 "2005-12-31" "-232.078" "6720" "474.1590" "10.11" "3949" "4" 
2006-03-31 "2006-03-31" "   3.642" "6720" "589.5614" "12.55" "3949" "1" 
2006-06-30 "2006-06-30" "   2.143" "6720" "514.9567" "10.94" "3949" "2" 
2006-09-30 "2006-09-30" "  21.518" "6720" "552.9757" "11.73" "3949" "3" 
2006-12-31 "2006-12-31" "  10.385" "6720" "651.7707" "13.19" "3949" "4" 
2007-03-31 "2007-03-31" "   4.767" "6720" "597.7659" "12.09" "3949" "1" 

对此我有点束手无策。我不确定我的编码是否不正确(我找不到使用 xts 对象列表的好例子),或者我的 xts 包是否有问题。我已经通过删除包然后使用 R-Forge 存储库重新安装来重新安装 xts,所以我应该拥有最新版本。

如果我可以提供任何其他信息,请告诉我。

【问题讨论】:

  • 如果你遇到段错误,你应该给包维护者发电子邮件(在这种情况下,我是合著者);它们是由错误引起的。 R-forge 版本可能不稳定。您对最新的 CRAN 版本(使用 R-2.13.1)还有问题吗?
  • 没关系;我可以使用 CRAN 上的版本进行复制。
  • 澄清 Josh 的第一个答案:如果您没有编译和链接自己的 C 或 Fortran 代码,则分段错误始终被视为错误。它通常是贡献包中的错误,而不是基础 R 中的错​​误。

标签: r xts lapply


【解决方案1】:

问题在于,lag 的 C 代码现在位于 zoo 包中,补丁已应用于 R-forge 源 - 尚未应用于 CRAN 版本。大约一周前已修复此问题。

更新您的 zoo 版本(来自 R-forge,版本号可能仍然相同),您应该会发现它可以工作。

【讨论】:

  • 感谢您的回复,杰夫。我正在尝试从 R-forge 安装,但遇到了一些问题。如果我尝试从install.packages 安装zoo,我会收到package not found 错误。如果我下载 tarball 并尝试安装(使用 install.packagesR CMD INSTALL),我会得到:Error in getOct(block, 100, 8) : invalid octal digit。任何想法可能是什么问题?
  • 好的,我可以在 Windows 的 2.13.1 中安装,所以它肯定是固定的。对于 Linux,我会等到更新推送到 CRAN,并希望 zoo 更新能够在那时在 2.12 中工作。
  • 不确定 getOc​​t 的问题是什么,但我会看看是否可以使用 zoo_lag 函数的本地副本修补 xts。至少在动物园在 CRAN 上更新之前。
猜你喜欢
  • 1970-01-01
  • 2014-01-11
  • 2020-03-16
  • 2016-09-03
  • 2020-07-20
  • 1970-01-01
  • 1970-01-01
  • 2014-05-17
  • 2012-08-05
相关资源
最近更新 更多