【问题标题】:Subsetting data in R doesn't workR中的子集数据不起作用
【发布时间】:2015-12-02 09:47:47
【问题描述】:

我正在尝试对我的数据进行子集化,但在我的一生中,我无法弄清楚为什么这不起作用。这是我的数据的链接,它是一个 csv 文件 Data。我已经尝试过这些方法来进行子集化,但它们都只是创建了一个没有观察的标题。

alveolar.df <- combine.df[combine.df$articulation == "velar_coronal", ]
alveolar.df <- subset(combine.df, articulation == "velar_coronal")
alveolar.df <- combine.df[combine.df$articulation %in% c("velar_coronal"), ]

这是一个数据样本-

combine.df <- structure(list(start = c(215.76, 278.78, 862.35, 1050.22, 512.59, 
552.97), end = c(217.18, 280.68, 863.85, 1051.72, 515.02, 555.67
), articulation = c(" velar_coronal", " velar_labial", " velar_coronal", 
" velar_coronal", " velar_coronal", " velar_coronal"), hometown = structure(c(1L, 
NA, 2L, 3L, 4L, 4L), .Label = c(" Montana ", "  ", " San Leandr ", 
" Southern California "), class = "factor")), .Names = c("start", 
"end", "articulation", "hometown"), row.names = c(NA, 6L), class = "data.frame")

【问题讨论】:

  • 只做 alveolar.df % filter(articulation == "velar_coronal")
  • @MLavoie 不幸的是,这只会返回很多 NA

标签: r


【解决方案1】:

您在列中有额外的空格,这就是为什么您从逻辑表达式中获得所有 FALSE 结果,因此您的子集中没有行。请注意下面每个字符串开头的多余空格。

combine.df$articulation
# [1] " velar_coronal" " velar_labial"  " velar_coronal" " velar_coronal"
# [5] " velar_coronal" " velar_coronal"
combine.df$articulation == "velar_coronal"
# [1] FALSE FALSE FALSE FALSE FALSE FALSE

实际上,您在不止一个专栏中遇到过这个问题。你可以做以下两件事之一:

  1. 最初将数据读入 R 时使用strip.white = TRUE(假设您使用了read.csv()read.table()

  2. 使用基础 R 中的新 trimws() 函数来修剪列中多余的空格

    combine.df$articulation <- trimws(combine.df$articulation) 
    

    然后再次尝试您的代码。

更好的方法是第一个,返回并再次读取数据,使用strip.white = TRUE,因为这样可以确保在任何列中都没有多余的空格。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2020-02-16
    • 1970-01-01
    • 2015-07-20
    • 2018-11-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多