【发布时间】:2014-03-21 21:24:35
【问题描述】:
我有一个外部 Hive 表,里面有一个 txt 文件的文件夹。那里有一些特殊字符,例如 ô、é、à、€、... 当我使用 Hive 查询此表时,这些字符显示为带有白色问号的黑色方块。
不过,我还有一个使用 sqoop 从 mysql 导入的 Hive 表,其中包含这些字符。当我查询此表时,字符确实会以正常方式显示。
当我从 hdfs 中提取文件时,字符也会以它们应该在终端中的方式显示。我是否必须以特定方式为不工作的 Hive 表设置字符编码?如果有,怎么做?
【问题讨论】:
标签: mysql utf-8 character-encoding hive sqoop