【问题标题】:Autocorrelation in binary time series with multiple groups多组二进制时间序列中的自相关
【发布时间】:2015-07-07 00:48:44
【问题描述】:

我正在尝试评估二进制分层结构生态数据时间序列中的自相关程度。我有关于在 11 年内每 6 个月在多个独立地点 (n = 469) 测量的有机体存在或不存在(1 或 0)的数据(产生 22 个等距时间点)。

这里有一些可以使用的虚拟数据:

# Create dummy time series (random 0 or 1 value for absent or present)
# Format of time series is matrix with rows as sites and columns as time points

set.seed(1)

dat <- matrix(sample(0:1, 469*22, replace=T), nrow=469, ncol=22)

我想知道每个地点生物体存在/不存在的序列相关程度(时间 = t 与时间 = t - 1、t - 2、t - 3、...、t - 21)。虽然数据是空间结构化的,但我并不真正关心特定站点的趋势,只关心整体关系。有人可以帮我确定格式化数据以用于包(例如“acf”)或旨在处理此问题的自定义函数的适当方式吗?

【问题讨论】:

    标签: r time-series binary-data cross-correlation


    【解决方案1】:

    这个怎么样?

    set.seed(1)
    
    dat <- data.frame(id=1:469,matrix(sample(0:1, 469*22, replace=T), nrow=469, ncol=22))
    library(tidyr);library(dplyr)
    
    
    dat %>%
      gather(time,dummy,-id)->dat2
    library(lme4)
    model<-glmer(dummy~time+(1|id),dat2,family="binomial")
    vcov(model) #variance-covariance matrix
    

    【讨论】:

    • 感谢您的建议。我喜欢这个方向,但我不确定它是否给了我正确的回应。从 GLMM 分析(使用 glmer)中,我知道时间 t-1 的存在-不存在是时间 t 存在-不存在的一个很好的预测因子。但这并没有出现在您建议的模型的方差-协方差矩阵图中。在这里查看水平图(显示我的真实数据,而不是虚拟数据):s10.postimg.org/pj468ak21/vocv_levelplot.jpg