【发布时间】:2012-06-10 13:02:21
【问题描述】:
我制作了一个删除 en 和 em 破折号的函数。伟大的!但是当我尝试将它上传到 github 然后作为一个包重新安装时,函数会发生一些事情。它将破折号替换为一些令人毛骨悚然的 gook 字符。这通常意味着 unicode 的东西。我希望能够导出函数。
我尝试将\\– 替换为\u2013 和0x2013。还使用了fixed 和perl 参数。没有运气。
这里是:
- 起作用的功能
- 一个测试用例
- 重新导入后的样子
代码:
#What I exported
incomp <- function (text.var){
x <- gsub("\\–", "|", x)
x <- gsub("\\—", "|", x)
return(x)
}
#here it is in action working well
x <- c("I like...", "well?.", "–", "—")
incomp(x)
#[1] "I like..." "well?." "|" "|" #what I look like (ain't I pretty?)
#what the exported function looks like when the package compiles
incomp <- function (text.var){
x <- gsub("[–]", "|", x)
x <- gsub("[—]", "|", x)
return(x)
}
#I don't work anymore
x <- c("I like...", "well?.", "(–", "—") #I'm broken
incomp(x)
搜索 r 和 unicode 会带来很多信息,但我似乎无法正确地将其应用于我的情况。
- u2013 为破折号
- u2014 用于破折号
这篇文章是在talkstats.com 上交叉发布的。我一般不会越过柱子,但我会迫不及待地想把它弄出来。我将链接这两个线程。 LINK TO THE TALKSTATS THREAD
提前谢谢你。
【问题讨论】: