【发布时间】:2016-12-01 18:01:50
【问题描述】:
我想将带有输入数据的表加载到配置单元中。我有以下格式的数据。
"153662";"0002241447";"0"
"153662";"000647036X";"0"
"153662";"0020434901";"0"
"153662";"0020973403";"0"
"153662";"0028604202";"0"
"153662";"0030437512";"0"
我想将此数据加载到具有两个 varchar 列和一个 int 列的表中。但是周围的双引号困扰着我。我创建了下表。
CREATE EXTERNAL TABLE Table(A varchar(50),B varchar(50),C varchar(50))
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\;'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE
但字段周围的引号也成为字段的一部分,如下所示。
"276725" "034545104X" "0"
"276726" "0155061224" "5"
我想忽略它们。此外,我希望将第三个字段读取为 INT。目前,当我在制作表格时将第三个字段作为 INT 提供时,它变为 NULL。
【问题讨论】: