【问题标题】:How can I remove "-" from all instances in a specific column?如何从特定列中的所有实例中删除“-”?
【发布时间】:2019-07-20 20:20:40
【问题描述】:

我一直在尝试从我的代码中删除所有“-”实例。我使用命令gsub("-","", dataframe$column) 无济于事。它没有显示任何错误,但它修复了一些实例而不是全部。文本以 UTF-8 编码。 “-”有多种书写方式,包括空格和短划线。例如。

Other --
Other- - -

当前文本类似于:

- - - Other 
- - Other   
- Other

我希望结果是这样的

Other
Other
Other

谢谢。

【问题讨论】:

  • 正确答案取决于该列的性质。它是因子还是字符列?请阅读minimal reproducible example 并搜索“如何制作出色的 R 示例”。
  • 还取决于您匹配的确切字符。几个字符看起来像-,但编码不同(减号、连字符、破折号、破折号……)。见jkorpela.fi/dashes.html
  • 是字符列。
  • @Mons 你还在寻找答案,这意味着我的不适合你。你能告诉我为什么吗?根据您对问题的描述,它应该可以工作。

标签: r string variables


【解决方案1】:

试试这个:

gsub(" *-+ *", "", "- - - Other")

它找到以下形式的所有子字符串:

Zero or more empty spaces, followed by

one or more minuses, followed by 

zero or more empty spaces

并从字符串中删除它们

【讨论】:

    【解决方案2】:

    库(字符串) str_remove_all(string, "-| ") 或 str_remove_all(string, "[:blank:]|[:punct:]")

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-06-01
      • 1970-01-01
      • 2011-01-12
      • 1970-01-01
      • 2022-11-21
      • 2011-07-14
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多