【问题标题】:Comparing two dataframes if a column from both has a common entry如果两者中的一列具有共同的条目,则比较两个数据框
【发布时间】:2017-12-10 10:40:30
【问题描述】:

我有两个 csv 文件,我正在使用 R-

https://drive.google.com/open?id=1CSLDs9qQXPMqMegdsWK2cQI_64B9org7

https://drive.google.com/open?id=1mVp1s0m4OZNNctVBn5JXIYK1JPsp-aiw

从文件中可以看出,每个文件都有一个从 2008 年到现在的日期列表以及其他列。

我希望我的输出是两个文件,但两个文件都应包含两个文件中存在的日期的数据行。

例如。说日期 X 不在 1 个文件上,那么它也应该从它所在的另一个文件中删除。只有日期和两列上存在的相应行才能在两个输出文件中保留。

我尝试了 dplyr 库中的 inner_join 函数,但没有成功,因为日期是因子格式。

【问题讨论】:

    标签: r dataframe compare


    【解决方案1】:

    可以通过添加stringAsFactors = F来避免字符串的因子转换。此外,在您的数据集中,您将 NA 编码为字符串 null,因此您还应该在对 read.csv 的调用中指定它

    path1 <- "the path for the first dataset KS"
    path2 <- "the path for the second dataset 105560.KS"
    df1 <- read.csv(path1,stringsAsFactors = F)
    df2 <- read.csv(path2,stringsAsFactors = F,na.strings = "null")
    
    df_comb <- inner_join(df1,df2,by = "Date")
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2016-08-02
      • 2022-01-27
      • 1970-01-01
      • 2017-01-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多