【问题标题】:Evaluation Error when tidyverse is loaded after Hmisc在 Hmisc 之后加载 tidyverse 时的评估错误
【发布时间】:2018-08-29 18:33:01
【问题描述】:

我正在使用 r 3.3.3、dplyr 0.7.4 和 Hmisc 4.1-1。我注意到我加载包的顺序会影响 dplyr::summaries 函数是否有效。我知道以不同的顺序加载包会掩盖某些功能,但我使用 package::function() 语法来避免这个问题。确切的问题围绕着标记变量。我知道过去 tidyverse 和变量标签存在问题,但似乎没有人能解决为什么会发生这种特殊情况。

第一个有效的例子 - 我只加载 Hmisc 然后 dplyr 并且我能够总结数据 -

#this works fine
library(Hmisc)
library(dplyr)

Hmisc::label(iris$Petal.Width) <- "Petal Width"

sumpct <- iris %>% 
  dplyr::group_by(Species) %>% 
  dplyr::summarise(med =median(Petal.Width),A40 = round(100*ecdf(Petal.Width)(.40),1),
            A50 =round(100*ecdf(Petal.Width)(.50),1),
            mns = mean(Petal.Width),
            lowermean = mean(Petal.Width)-sd(Petal.Width),
            lowermedian = median(Petal.Width) - sd(Petal.Width))

下面的第二个示例中断。我开始一个新会话并在 Hmisc 之后加载 tidyverse 并仍然使用 package::function() 语法,但这会引发错误:

summarise_impl(.data, dots) 中的错误:评估错误:xlabels 必须是同一类型。

第二个例子:

###restart session 
#this example does not work

library(Hmisc)
library(tidyverse)


Hmisc::label(iris$Petal.Width) <- "Petal Width"

sumpct <- iris %>% 
  dplyr::group_by(Species) %>% 
  dplyr::summarise(med =median(Petal.Width),A40 = round(100*ecdf(Petal.Width)(.40),1),
                   A50 =round(100*ecdf(Petal.Width)(.50),1),
                   mns = mean(Petal.Width),
                   lowermean = mean(Petal.Width)-sd(Petal.Width),
                   lowermedian = median(Petal.Width) - sd(Petal.Width))

但是,第三个示例确实有效,我只是在 Hmisc 之前重新启动会话并加载 tidyverse

第三个例子:

###switch order of loading packages and this works

library(tidyverse)
library(Hmisc)


Hmisc::label(iris$Petal.Width) <- "Petal Width"

sumpct <- iris %>% 
  dplyr::group_by(Species) %>% 
  dplyr::summarise(med =median(Petal.Width),A40 = round(100*ecdf(Petal.Width)(.40),1),
                   A50 =round(100*ecdf(Petal.Width)(.50),1),
                   mns = mean(Petal.Width),
                   lowermean = mean(Petal.Width)-sd(Petal.Width),
                   lowermedian = median(Petal.Width) - sd(Petal.Width)) 

所以我的问题是为什么我在使用 package::function() 语法时加载包的顺序很重要,特别是关于标记变量和 tidyverse?

更新:错误的会话信息如下:

sessionInfo()

R 版本 3.3.3 (2017-03-06) 运行条件:Windows 7 x64 附加的基础包:[1] stats graphics grDevices utils datasets methods base

其他附加包:[1] bindrcpp_0.2 forcats_0.3.0
stringr_1.3.0 dplyr_0.7.4 [5] purrr_0.2.4 readr_1.1.1
tidyr_0.8.0 tibble_1.4.2 [9] tidyverse_1.2.1 Hmisc_4.1-1
ggplot2_2.2.1 Formula_1.2-2 [13]survival_2.41-3 lattice_0.20-35

通过命名空间加载(未附加):[1] reshape2_1.4.3
splines_3.3.3 Have_1.1.1 [4] colorspace_1.3-2
htmltools_0.3.6 base64enc_0.1-3 [7] rlang_0.2.0
柱子_1.2.1 国外_0.8-69 [10] 胶水_1.2.0
RColorBrewer_1.1-2 readxl_1.0.0 [13] modelr_0.1.1
plyr_1.8.4 bindr_0.1.1 [16] cellranger_1.1.0
munsell_0.4.3 gtable_0.2.0 [19] rvest_0.3.2
htmlwidgets_1.0 psych_1.7.8 [22] latticeExtra_0.6-28 knitr_1.20 parallel_3.3.3 [25] htmlTable_1.11.2
broom_0.4.3 Rcpp_0.12.16 [28] acepack_1.4.1
scales_0.5.0 backports_1.1.2 [31] checkmate_1.8.5
jsonlite_1.5 gridExtra_2.3 [34] mnormt_1.5-5
hms_0.4.2 digest_0.6.15 [37] stringi_1.1.7
grid_3.3.3 cli_1.0.0 [40] 工具_3.3.3
magrittr_1.5lazyeval_0.2.1 [43] cluster_2.0.6
crayon_1.3.4 pkgconfig_2.0.1 [46] Matrix_1.2-12
xml2_1.2.0 data.table_1.10.4-3 [49] lubridate_1.7.3
assertthat_0.2.0 httr_1.3.1 [52] rstudioapi_0.7
R6_2.2.2 rpart_4.1-13 [55] nnet_7.3-12
nlme_3.1-131.1

【问题讨论】:

  • 我刚试过这个,第二个和第三个选项都给了我错误。那么也许是与 Hmisc 和 tidyverse 的组合有关,而不是包装顺序?令人费解
  • 有趣 我刚刚再次尝试了第三个示例,它成功了,您使用的是什么版本,您是否重新启动了会话?不管怎样,这都是一个有趣的问题。
  • 我目前有 Hmisc 4.1-1、dplyr 0.74、tidyverse 1.2.1、R 3.4.3。我将尝试更新 R 和所有其他软件包以查看会发生什么,建议您也这样做并发布您的会话信息
  • 刚刚添加的会话信息
  • 只是为了深入研究这个问题,一个最小的例子是在你将标签分配给iris$Petal.Width 之后执行head(iris)

标签: r dplyr tidyverse hmisc


【解决方案1】:

更新:截至haven version 2.0.0,此问题已得到解决,因为“已标记”的避风港类已重命名为"haven_labelled",以避免与Hmisc发生冲突。


tl;dr:订单很重要。

想要更详细的答案,我们先复现错误:

library(Hmisc)
#> Loading required package: lattice
#> Loading required package: survival
#> Loading required package: Formula
#> Loading required package: ggplot2
#> 
#> Attaching package: 'Hmisc'
#> The following objects are masked from 'package:base':
#> 
#>     format.pval, units
library(tidyverse)
#> Warning: package 'forcats' was built under R version 3.4.4

从原始summarise 示例中逐个删除元素后, 我设法将错误重现减少到这些代码行:

Hmisc::label(iris$Petal.Width) <- "Petal Width"
head(iris)
#> Error: `x` and `labels` must be same type

我们可以查看回溯,看看是否可以找到可能导致错误的函数:

traceback()
#> 8: stop("`x` and `labels` must be same type", call. = FALSE)
#> 7: labelled(NextMethod(), attr(x, "labels"))
#> 6: `[.labelled`(xj, i)
#> 5: xj[i]
#> 4: `[.data.frame`(x, seq_len(n), , drop = FALSE)
#> 3: x[seq_len(n), , drop = FALSE]
#> 2: head.data.frame(iris)
#> 1: head(iris)

[.labelled 电话看起来很可疑。为什么叫它?

lapply(iris, class)
#> $Sepal.Length
#> [1] "numeric"
#> 
#> $Sepal.Width
#> [1] "numeric"
#> 
#> $Petal.Length
#> [1] "numeric"
#> 
#> $Petal.Width
#> [1] "labelled" "numeric" 
#> 
#> $Species
#> [1] "factor"

啊,用Hmisc::labelPetal.Width 设置标签还添加了S3 类。 我们可以用getAnywhere检查方法在哪里定义:

getAnywhere("[.labelled")
#> 2 differing objects matching '[.labelled' were found
#> in the following places
#>   registered S3 method for [ from namespace haven
#>   namespace:Hmisc
#>   namespace:haven
#> Use [] to view one of them

确实,havenHmisc 都定义了方法。因为haven 是 在Hmisc 之后加载,首先找到它的定义,从而被使用:

getAnywhere("[.labelled")[1]
#> function (x, ...) 
#> {
#>     labelled(NextMethod(), attr(x, "labels"))
#> }
#> <environment: namespace:haven>

haven 期望 labelled 对象具有 labels 属性,它 Hmisc::label 不创建:

attr(iris$Petal.Width, "labels")
#> NULL

这就是错误的来源。


但是等等:为什么haven 甚至被加载了?它没有与library(tidyverse) 关联。 原来,haventidyverse 中是listed as an imported package, 这会导致它在附加包时被加载(参见例如 here)。并加载一个包裹, 除其他外,注册其 S3 方法:这是冲突的地方 来自。

事实上,如果您想同时使用Hmisctidyverse,顺序很重要。 要进一步解决该问题,可能需要在 包对labelled S3 类的使用。

reprex package (v0.2.0) 于 2018 年 3 月 21 日创建。

【讨论】:

  • 令人难以置信的答案和漏洞挖掘!小问题,不能手动覆盖该方法吗?对于一个简单的函数,我会写类似`[.labelled` &lt;- Hmisc::`[.labelled`,但它似乎不适用于这里。
  • @DanChaltiel 好问题,但我不得不说我在这里有点超出我的深度。我认为这涉及到 S3 方法调度如何工作的细节(我无法通过快速搜索找到一个好的参考),但似乎它的要点是在全局方法之前找到加载包中的方法环境。一个 hack-y 解决方法可能是覆盖 haven 命名空间中的方法(但要小心,如果你真的想在某个时候使用 haven 版本!)。这应该可以解决问题:assignInNamespace("[.labelled", Hmisc:::"[.labelled", asNamespace("haven")).
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-06-26
  • 2018-04-21
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多