【问题标题】:How to get R to read all the other human languages?如何让 R 阅读所有其他人类语言?
【发布时间】:2018-11-19 19:09:49
【问题描述】:

谁能告诉我如何让 R 正常显示所有人类语言。我的问题是我有一个数据框,其中包含以欧盟所有语言编写的新闻文章标题。糟糕的数据库设计cets,如何让R以各自的语言显示每一行?

我阅读了this R bloggers post,将Sys.setlocale 更改为其中一种语言是有道理的,但是最后执行的命令才是最重要的。手动将数据库分离到每种语言箱中并为每种语言运行脚本是可能的,但我宁愿不这样做。

感谢!

编辑:

Link to base .xls document

要导入的R代码:

 library(data.table)
library(XLConnect)
library(stringr)
library(stringi)
library(dplyr)

#load .xls
wb <- loadWorkbook('D:/MOMUT1/GIS_Workload/Other/alex/Book2_1.xls')
df <- readWorksheet(wb, 1, header = TRUE)

#remove NAs
df_final <- subset(df, !is.na(df$HEADLINE))

#take out HEADLINE column to work on
head_col <- data.table(df_final$HEADLINE)

运行于:Windows 10 Pro 1803 64bit RStudio 3.4.4

【问题讨论】:

  • 我的第一个想法是字符串向量通常只在一个语言环境中显示。如果您提供一个示例(可能是 3-4 种不同的语言),也许我们可以使用它。 (我建议粘贴来自dput(head(x,n=4)) 的输出,只包含需要的列。)
  • 您使用的是什么操作系统?您只使用 R 还是 Studio?
  • 我编辑了问题以包含信息

标签: r string non-english


【解决方案1】:

处理多种语言时的一种解决方案是在 Linux 中运行 R,其中 UTF-8 是标准编码。由于您使用的是 Win 10 Pro,因此您可以在 Windows Subsystem for Linux 中执行此操作,而无需从头开始安装操作系统。

  1. 安装 WSL:https://docs.microsoft.com/en-us/windows/wsl/install-win10(Ubuntu 可能是发行版的最佳选择)
  2. 安装R:http://sites.psu.edu/theubunturblog/installing-r-in-ubuntu/
  3. 通过install.packages 安装您需要的任何软件包。您可能必须自己安装系统库依赖项。
  4. 运行您的分析。

警告:我实际上还没有尝试过。此外,您将从命令行而不是使用 RStudio 运行 R。

【讨论】:

  • Linux 就是这样!谢谢你的解释!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-12-06
  • 2019-11-28
  • 1970-01-01
  • 2010-10-03
  • 2011-12-15
相关资源
最近更新 更多