【发布时间】:2016-11-16 19:46:21
【问题描述】:
我尝试使用 Sqoop v1.4 将 MySQL 表导入 Hive
sqoop import --connect jdbc:mysqll//localhost:3306/mysqldb \
--username user --password pwd --table mysqltbl \
--hive-import --hive-overwrite \
--hive-table hivedb.hivetbl -m 1 \
--null-string '\\N' \
--null-non-string '\\N' \
mysqltbl中有100行,其中text其中一个字段包含\t和\n,导致Sqoop解析数据不正确,即hivetbl有100多行和字段没有对齐。
MySQL中不转义特殊字符,Sqoop中如何指定字段和记录的分隔符?
【问题讨论】:
-
你可以尝试使用orc、parquet或avro来代替简单的文本格式。