【问题标题】:Install/importing R packages into python with rpy2, imports/ignores the packet in question使用 rpy2 将 R 包安装/导入到 python 中,导入/忽略有问题的数据包
【发布时间】:2019-01-09 15:03:17
【问题描述】:

这是我想要做的:

  1. 我想使用discrete Kolmogorov-Smirov Goodness-of-fit test,目前仅在 R 中可用。此外,R has the normal KS test as well -- 我不想使用此测试。
  2. 我是python用户,所以需要将离散KS测试移植到python,这样做I am trying to userpy2

我面临的问题,如更多统计细节here 中所述,rpy2 似乎用标准版本替换了导入的离散测试。我知道这一点是因为它在测试时不会产生正确的答案。

目前的尝试

import rpy2.robjects.packages as r
utils = r.importr("utils")
package_name = "dgof"
utils.install_packages(package_name)

结果

/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: 

  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: 
  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: The downloaded source packages are in
    ‘/tmp/RtmpTBas6a/downloaded_packages’
  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Updating HTML index of packages in '.Library'

  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Making 'packages.html' ...
  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning:  done

  warnings.warn(x, RRuntimeWarning)
rpy2.rinterface.NULL

好的,到目前为止一切顺利,应该已经安装了它。所以让我们导入它:

# Import Discrete goodness-of-fit package which includes KS and CVM tests.
dgof = rpackages.importr('dgof')

真的进口了吗?让我们看看:

env = r.wherefrom('dgof')

返回

/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Error: object 'dgof' not found

  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: In addition: 
  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Warning message:

  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: In (function (x, y, ..., alternative = c("two.sided", "less", "greater"),  :
  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: 

  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning:  cannot compute correct p-values with ties

  warnings.warn(x, RRuntimeWarning)

  warnings.warn(x, RRuntimeWarning)

好吧,这很奇怪,但也许它仍然有效,让我们看看 (this is exactly the same example as used on the R side 并且应该返回 D = 0.66667, p-value = 0.07407):

import rpy2.robjects.numpy2ri
rpy2.robjects.numpy2ri.activate()
import numpy as np
a = np.array([1,1,1])
b = np.arange(1,3)
dgof.ks_test(a,b)

返回

D = 0.5, p-value = 0.925086

如果这对你来说没有任何意义,那你需要知道它是错误的。这似乎是错误的,因为不知何故,标准ks_test 被加载以代替离散的(我们在上面列表中的第2 项中讨论的那个)。让我们通过加载标准库和 KS 测试来验证:

from rpy2.robjects.packages import importr
base     = importr('base')
stats    = importr('stats')
import rpy2.robjects.numpy2ri
rpy2.robjects.numpy2ri.activate()
import numpy as np

a = np.array([1,1,1])
b = np.arange(1,3)
stats.ks_test(a,b)

返回

D = 0.5, p-value = 0.925086

这很酷——有人知道为什么会发生这种情况吗?

注意: this question is related to my other question,但在 python 方面有更多细节。

【问题讨论】:

    标签: python r rpy2 kolmogorov-smirnov


    【解决方案1】:

    真的进口了吗?让我们看看:

    env = r.wherefrom('dgof')
    

    返回

    /home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Error: object 'dgof' not found
    

    RRuntimeWarning 来自 R 本身,这是人们所期望的。没有对象dgof,因为 R 包命名空间不是对象。

    你想要的可能是wherefrom('ks.test')(见 https://rpy2.github.io/doc/v2.9.x/html/robjects_rpackages.html#finding-where-an-r-symbol-is-coming-from)。

    这之间可能会发生很多事情,这取决于包“dgof”正在做什么(如果您来自 Python,R 可以让包开发人员做一些非常奇怪的事情)。

    您是否尝试过依赖 R 的调度和函数重载机制?加载R包dgof后,调用ks.test不指定命名空间。

    dgof = rpackages.importr('dgof')
    import rpy2.robjects
    # "generic" function ks.test
    ks_test = rpy2.robjects.r('ks.test')
    # Use it
    ks_test(a, b)
    

    【讨论】:

    • 嗨!我试了一下,但恐怕还是不行。
    • 好吧,因为这使用 R 自己的 ks.test 调度,所以您通过 rpy2 传递的变量不同,或者您报告的纯 R 版本正在工作(我不知道)目前没有dgof 可以尝试)。要评估前者,请尝试以下操作以查看您的 Python 向量是如何转换的:robjects.globalenv['a'] 然后robjects.r('print(a)')
    猜你喜欢
    • 2014-06-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-10-21
    • 2019-05-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多