【发布时间】:2018-04-25 15:31:36
【问题描述】:
我正在尝试使用 mysql 中的 sqoop 导入增量负载。下面是我在 unix 控制台上运行的命令:
sqoop job \
--create sample_job --import -Dmapred.job.queue.name=realtime \
--connect jdbc:mysql://hostname/db?zeroDateTimeBehavior=convertToNull \
--driver com.mysql.jdbc.Driver \
--table SAMPLE_TABLE -m 1 \
--username tony \
--password stark \
--incremental lastmodified \
--check-column ts \
--last-value 2018-04-24 \
--target-dir /some/tmp/location/ \
--map-column-hive XYZ=tinyint \
--null-string '\\N' \
--null-non-string '\\N'
但是,得到一个典型的参数错误:
/usr/hdp/2.6.4.0-91//sqoop/conf/sqoop-env.sh: line 21: HADOOP_CLASSPATH=${hcat -classpath}: bad substitution
Warning: /usr/hdp/2.6.4.0-91/accumulo does not exist! Accumulo imports will fail.
Please set $ACCUMULO_HOME to the root of your Accumulo installation.
18/04/25 11:24:52 INFO sqoop.Sqoop: Running Sqoop version: 1.4.6.2.6.4.0-91
18/04/25 11:24:52 ERROR tool.BaseSqoopTool: Error parsing arguments for job:
我发现很多可用的资源展示了如何使用命令运行导入,但大多数资源没有显示确切的命令行并且传递了不正确的参数。我在某处看到参数的顺序很重要,因此尝试切换顺序但没有用。这是一个简单的问题,所以有人可以告诉我正确的语法吗?
提前致谢。
【问题讨论】:
标签: hadoop hive sqoop cloudera hortonworks-data-platform