【问题标题】:Power BI: Get data R script encodingPower BI:获取数据 R 脚本编码
【发布时间】:2017-05-15 09:36:23
【问题描述】:

我想使用 R 脚本(通过 Get Data -> Other-> R script)将数据导入 Power BI。

但是,最终导入的数据集对字符(字符串)类型的列的编码错误。

例如,如果我使用以下示例 R 脚本:

library(data.table)

dt<-data.table(str=c("Весна","Лето","Осень","Зима","И снова весна"),num=seq(1,5))

导入数据集:

如果我尝试将 Encoding(dt$str)&lt;-"UTF-8" 添加到 R 脚本代码中,我会收到以下错误:

"无法从指定代码页转换索引 -1 处的字节 [C2] 到 Unicode。”

我想使用 R 脚本,因为我需要进行一些计算并合并几个大数据集,然后在 Power BI 可视化中使用合并的结果。 (只是纯粹的可视化目的)

使用其他符号则更糟。例如,让我们试试这个

dt<-data.frame(str=c("Көктем","Жаз","Күз","Қыс","Алақай, көктем келді!"),num=seq(1,5))

它甚至不导入任何东西,只是抛出错误:

ADO.NET:R 脚本错误

rScriptWrapper_options = getOption('save.image.defaults') save(list = rScriptWrapper_dataFrames, file = "globalEnv.rdata

但是,我在 RStudio 和 R GUI 中都没有遇到此类错误,所以我怀疑问题出在 R 中。

在这种情况下有没有办法改变编码?

【问题讨论】:

    标签: r encoding utf-8 powerbi


    【解决方案1】:

    【讨论】:

    • 非常感谢!它可以帮助我处理西里尔字母,但我仍然遇到非西里尔字母的问题:(
    • 我在之前的情况下使用 stringi 库和 rScriptWrapper_options 出现意外的字符串常量错误(没有 stringi)
    • 恐怕问题不在于 R 本身。它在 Rstudio 和 RGui 中运行正常,我不知道为什么它在首先导入纯数据集(没有正确编码)时会引发错误。我想主要问题是某些字符看起来像 - 中提琴你得到了错误。 Str_encode 对那些特殊字符没有帮助
    猜你喜欢
    • 1970-01-01
    • 2021-12-14
    • 1970-01-01
    • 2021-05-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-01-20
    相关资源
    最近更新 更多