【发布时间】:2012-11-16 14:43:55
【问题描述】:
从包含 1600 万个字符串变量的向量中去除德语(或法语)重音的最佳方法是什么。
例如,“干燥综合征”变成“干燥综合征”
将单个字符转换为单个字符比音译更好,例如
ä => ae ö => oe ü => ue.
例如,使用正则表达式是一种选择,但有没有更好的方法(R 包)?
gsub('ü','u',gsub('ö','o',"Sjögren's syndrome ( über) "))
对于非 R 平台有 SO 解决方案,但对于 R 来说不是一个好的解决方案。
【问题讨论】:
-
查看这篇文章的答案:[stackoverflow.com/questions/23699271/force-character-vector-encoding-from-unknown-to-utf-8-in-r][1] [ 1]:stackoverflow.com/questions/23699271/…
标签: r transliteration