【问题标题】:how to select columns from R dataframe in rpy2 in python?如何在 python 的 rpy2 中从 R 数据框中选择列?
【发布时间】:2015-10-08 10:52:31
【问题描述】:

我在 python 的 rpy2 中有一个数据框,我想从中提取列。这个 R 代码的 rpy2 等价物是什么?

df[,c("colA", "colC")]

这可以获取第一列:

mydf.rx(1)

但是我怎样才能拉出一组列,例如第一、第三、第五?

mydf.rx([1,3,5])

不起作用。也没有:

mydf.rx(rpy2.robjects.r.c([1,3,5]))

【问题讨论】:

    标签: python r dataframe rpy2


    【解决方案1】:

    我发现最好的方法是做这个简单的事情:

    from rpy2.robjects.packages import importr
    from rpy2.robjects import pandas2ri
    import rpy2.robjects as robjects
    
    dataframe = robjects.r('data.frame')
    df_rpy2 = dataframe([1,2,],[5,6])
    df_pd = pd.DataFrame({'A': [1,2], 'B': [5,6]})
    
    base = importr('base') #Creates an instance of R's base package 
    pandas2ri.activate() #Converts any pandas dataframe to R equivalent
    
    base.colnames(df_pd) #Finds the column names of the dataframe df_pd 
    base.colnames(df_rpy2) #Finds the column names of the dataframe df_rpy2
    

    输出是:

    R object with classes: ('character',) mapped to:
    <StrVector - Python:0x7fa3504d3048 / R:0x10f65ac0>
    ['X1L', 'X2L', 'X5L', 'X6L']
    
    R object with classes: ('character',) mapped to:
    <StrVector - Python:0x7fa352493548 / R:0x103b6e40>
    ['A', 'B']
    

    这适用于使用 pandas 和 rpy2 创建的数据框。希望这会有所帮助!

    【讨论】:

      【解决方案2】:

      或者,您可以将 R 数据框传递给 Python pandas 数据框,并将生成的 1、3、5 列作为子集:

      #!/usr/bin/python
      import rpy2
      import rpy2.robjects as ro
      import pandas as pd
      import pandas.rpy.common as com
      
      # SOURCE R SCRIPT INSIDE PYTHON 
      ro.r.source('C:\\Path\To\R script.R') 
      
      # DEFINE PYTHON DF AS R DF
      pydf = com.load_data('rdf')
      cols = pydf[[1,3,5]]
      

      【讨论】:

        【解决方案3】:

        我认为答案是:

        # cols to select
        c = rpy2.robjects.IntVector((1,3))
        # selection from df
        mydf.rx(True, c)
        

        【讨论】:

          猜你喜欢
          • 2018-01-19
          • 1970-01-01
          • 1970-01-01
          • 2016-01-15
          • 2020-10-13
          • 1970-01-01
          • 1970-01-01
          • 2019-03-04
          • 2016-06-17
          相关资源
          最近更新 更多