【问题标题】:Export unicode characters for package导出包的 unicode 字符
【发布时间】:2012-06-10 13:02:21
【问题描述】:

我制作了一个删除 en 和 em 破折号的函数。伟大的!但是当我尝试将它上传到 github 然后作为一个包重新安装时,函数会发生一些事情。它将破折号替换为一些令人毛骨悚然的 gook 字符。这通常意味着 unicode 的东西。我希望能够导出函数。

我尝试将\\– 替换为\u20130x2013。还使用了fixedperl 参数。没有运气。

这里是:

  1. 起作用的功能
  2. 一个测试用例
  3. 重新导入后的样子

代码:

#What I exported
incomp <- function (text.var){
    x <- gsub("\\–", "|", x)
    x <- gsub("\\—", "|", x)
    return(x)
}

#here it is in action working well
x <- c("I like...", "well?.", "–", "—")
incomp(x)

#[1] "I like..." "well?."    "|"  "|"   #what I look like (ain't I pretty?)

#what the exported function looks like when the package compiles
incomp <- function (text.var){   
    x <- gsub("[–]", "|", x)
    x <- gsub("[—]", "|", x)
    return(x)
}

#I don't work anymore
x <- c("I like...", "well?.", "(–", "—")   #I'm broken
incomp(x)

搜索 r 和 unicode 会带来很多信息,但我似乎无法正确地将其应用于我的情况。

The unicodes are:

  • u2013 为破折号
  • u2014 用于破折号

这篇文章是在talkstats.com 上交叉发布的。我一般不会越过柱子,但我会迫不及待地想把它弄出来。我将链接这两个线程。 LINK TO THE TALKSTATS THREAD

提前谢谢你。

【问题讨论】:

    标签: r unicode


    【解决方案1】:

    我猜,导出 R 语言环境时的默认设置为“C”。您的语言环境可能不同。 也许你可以在你的包中使用 Sys.setlocale?

    【讨论】:

      猜你喜欢
      • 2023-03-18
      • 2020-12-19
      • 2020-05-06
      • 2011-01-28
      • 2018-04-01
      • 2016-10-30
      • 1970-01-01
      • 2019-01-29
      • 2011-03-31
      相关资源
      最近更新 更多