【问题标题】:Remove special character string from R从 R 中删除特殊字符串
【发布时间】:2019-04-01 10:30:18
【问题描述】:

试图在 R 上运行 tm,但我无法摆脱 – 作为字符串。我试过"–"â€\“"'–'。试图在myStopwords <- c("issu","base","...")中包含字符串

【问题讨论】:

    标签: r special-characters tm


    【解决方案1】:

    尝试gsub函数替换除可打印字符以外的字符:[:alnum:][:punct:]space gsub("[^[:print:]]"," ",text)

    【讨论】:

      【解决方案2】:

      我们可以使用gsub 来删除特定的单词:

      string ="– test – data –" # This is your sample input
      gsub("–","",string)  # Remove †from your string
      

      输出:

      [1] " test  data "
      

      【讨论】:

      • 谢谢...但字符串是 3 个字符:–
      • 我认为是“我有问题”
      • 谢谢。我正在尝试从名为 docs 的语料库中删除它。我以前试过。 str_replace_all(docs, "[^[:alnum:]]", "")
      猜你喜欢
      • 2012-05-04
      • 2011-04-11
      • 2016-01-23
      • 1970-01-01
      相关资源
      最近更新 更多