【问题标题】:(R) Error in Xi - Xj : non-numeric argument to binary operator(R) Xi - Xj 中的错误:二元运算符的非数字参数
【发布时间】:2021-08-18 05:15:51
【问题描述】:

我正在使用 R 编程语言。我正在尝试在这里重新创建本教程中显示的图表:https://www.rpubs.com/cboettig/greta-gp

本教程展示了如何为 2 个变量创建特殊类型的回归模型。我能够复制并粘贴本教程中的代码并成功制作所需的图表:

#PART 1
#load libraries
library(MASS)
library(tidyverse)

#set seed
set.seed(12345)

#create initial data
x_predict <- seq(-5,5,len=50)
l <- 1

#define functions for evaluating the covariance
SE <- function(Xi,Xj, l) exp(-0.5 * (Xi - Xj) ^ 2 / l ^ 2)
cov <- function(X, Y) outer(X, Y, SE, l)
COV <- cov(x_predict, x_predict)

#sample these functions, place them into a data frame and plot
values <- mvrnorm(200, rep(0, length=length(x_predict)), COV)
dat <- data.frame(x=x_predict, t(values)) %>%
  tidyr::pivot_longer(-x, names_to = "rep", values_to = "value") %>% 
  mutate(rep = as.numeric(as.factor(rep)))

ggplot(dat,aes(x=x,y=value)) +
  geom_line(aes(group=rep), color =  rgb(0.7, 0.1, 0.4), alpha = 0.4) 

#PART2

#create new data

obs <- data.frame(x = c(-4, -3, -1,  0,  2),
                  y = c(-2,  0,  1,  2, -1))

#repeat steps from part 1

cov_xx_inv <- solve(cov(obs$x, obs$x))
Ef <- cov(x_predict, obs$x) %*% cov_xx_inv %*% obs$y
Cf <- cov(x_predict, x_predict) - cov(x_predict, obs$x)  %*% cov_xx_inv %*% cov(obs$x, x_predict)

values <- mvrnorm(200, Ef, Cf)

dat <- data.frame(x=x_predict, t(values)) %>%
  tidyr::pivot_longer(-x, names_to = "rep", values_to = "value") %>% 
  mutate(rep = as.numeric(as.factor(rep)))


gp <- data.frame(x = x_predict, Ef = Ef, sigma = 2*sqrt(diag(Cf)) )

ggplot(dat,aes(x=x,y=value)) + 
  geom_line(aes(group=rep), color =  rgb(0.7, 0.1, 0.4), alpha = 0.2) + #REPLICATES
  geom_ribbon(data = gp, 
              aes(x, 
                  y = Ef, 
                  ymin = Ef - sigma, 
                  ymax = Ef + sigma),
              fill="grey", alpha = 0.4) +
  geom_line(dat = gp, aes(x=x,y=Ef), size=1) + #MEAN
  geom_point(data=obs,aes(x=x,y=y)) +  #OBSERVED DATA
  scale_y_continuous(lim=c(-3,3), name="output, f(x)") +
  xlab("input, x")

现在,我正在尝试为具有 3 个变量(1 个响应,2 个预测变量)的回归模型复制上述教程。我试图让“x_predict”对象有两列:

x_predict_1 <- seq(-5,5,len=50)
x_predict_2 <- seq(-6,6,len=50)

l <- 1

x_predict <- data.frame(x_predict_1, x_predict_2)


COV <- cov(x_predict, x_predict)

但这会产生以下错误:

Error in Xi - Xj : non-numeric argument to binary operator 

此错误使我无法从第 1 部分创建“值”和“dat”对象,并且我无法创建所需的图表(例如 x_predict_1 与值和 x_predict_2 与值)。这也使我无法在第 2 部分中创建所需的图表。

谁能告诉我如何解决这个问题? 谢谢

【问题讨论】:

  • 这看起来很破旧COV &lt;- cov(x_predict, x_predict)(这些不是正确的变量名)。但更重要的是,我只看到两个变量。
  • 我在出现错误 COV
  • @AnupTirpude :我再次运行它,仍然得到同样的错误。您是否可能正在运行“x_predict”的旧定义?现在,x_predict
  • 我同意@AnupTirpude:代码运行正常。
  • 到底是什么问题,为什么会出现错误,或者如何制作/修复图表?我只运行了最后一段代码,并且像这里的其他人一样,没有收到错误,所以如果问题是关于错误的,它似乎无法重现。如果问题是关于图表的,那需要更清楚。无论哪种方式,这将有助于将其缩小到 minimal reproducible example 的最小部分

标签: r ggplot2 dplyr regression data-visualization


【解决方案1】:

我想我有问题。首先,下面是我们可以重现错误的方式以及您进行的方式:

#PART 1
#load libraries
library(MASS)
library(tidyverse)

#set seed
set.seed(12345)

#create initial data
x_predict <- seq(-5,5,len=50)
l <- 1

#define functions for evaluating the covariance
SE <- function(Xi,Xj, l) exp(-0.5 * (Xi - Xj) ^ 2 / l ^ 2)
cov <- function(X, Y) outer(X, Y, SE, l)
COV <- cov(x_predict, x_predict)

#sample these functions, place them into a data frame and plot
values <- mvrnorm(200, rep(0, length=length(x_predict)), COV)
dat <- data.frame(x=x_predict, t(values)) %>%
  tidyr::pivot_longer(-x, names_to = "rep", values_to = "value") %>% 
  mutate(rep = as.numeric(as.factor(rep)))

ggplot(dat,aes(x=x,y=value)) +
  geom_line(aes(group=rep), color =  rgb(0.7, 0.1, 0.4), alpha = 0.4) 


x_predict_1 <- seq(-5,5,len=50)
x_predict_2 <- seq(-6,6,len=50)

l <- 1

x_predict <- data.frame(x_predict_1, x_predict_2)

COV <- cov(x_predict, x_predict)

这段代码最后会报错,同样被 Noob 高亮显示

这里需要注意的是,base R 中的 cov 函数被重新定义并设置如下

cov <- function(X, Y) outer(X, Y, SE, l)

此自定义函数仅适用于向量/数组,不适用于 data.frames,这是在扩展代码时用于连接 x_predict_1 和 x_predict_1 的方法。

如果此自定义函数在 data.frame 对象上调用,它总是会导致错误,因为它不是为处理 data.frame 而构建的,它仅用于数字向量和数组

现在,当任何新人尝试在两者之间复制它时,默认情况下,他将使用基础 R 中的“cov”函数。该函数适用于 data.frame 对象。因此强烈建议不要在 R 中重新定义现有函数,这会导致很多混乱。如果我们移除自定义的 'cov' 函数并调用 cov(x_predict, x_predict) ,它将正常工作,将从基础 R 包中调用。

所以要解决这个问题,Noob 你只需要在加入 x_predict_1 和 x_predict_2 时使用'c'(组合)而不是'data.frame',你的问题就会解决。我给出了我用你的变量尝试过的完整代码:

library(MASS)
library(tidyverse)

#set seed
set.seed(12345)

SE <- function(Xi,Xj, l) exp(-0.5 * (Xi - Xj) ^ 2 / l ^ 2)
cov <- function(X, Y) outer(X, Y, SE, l)

x_predict_1 <- seq(-5,5,len=50)
x_predict_2 <- seq(-6,6,len=50)

l <- 1

x_predict <- c(x_predict_1, x_predict_2)
head(x_predict,5)
COV <- cov(x_predict, x_predict)

values <- mvrnorm(200, rep(0, length=length(x_predict)), COV)
dat <- data.frame(x=x_predict, t(values)) %>%
  tidyr::pivot_longer(-x, names_to = "rep", values_to = "value") %>% 
  mutate(rep = as.numeric(as.factor(rep)))

ggplot(dat,aes(x=x,y=value)) +
  geom_line(aes(group=rep), color =  rgb(0.7, 0.1, 0.4), alpha = 0.4) 

最终结果将在图表下方。我希望这个解释能解决你的问题,如果没有,请告诉我。

在这里,如果您不想使用 'c'(组合),您可以使用 cbind 并创建一个矩阵。在它上面你可以成功地使用你的自定义函数'cov'它会起作用。但是,当您进一步使用这种方法时,您最终会出现另一个错误。下面是第一个由于 COV 是一个数组而发生的。因此我认为或者我猜想使用 c (combine) 是你所需要的。

【讨论】:

  • 嗨,Noob,有什么消息吗?它解决了你的问题吗?
  • 嗨,阿诺普!很抱歉延迟回复。这看起来棒极了!
猜你喜欢
  • 2016-11-15
  • 1970-01-01
  • 2019-05-03
  • 2016-11-14
  • 2021-03-24
  • 1970-01-01
  • 2021-03-24
  • 1970-01-01
相关资源
最近更新 更多