【发布时间】:2017-01-15 11:43:05
【问题描述】:
考虑 2000 年的数据。
test.csv
country_code,product_code,rpt_period 我们,crd,2000 我们,PCL,2000 我们,mtg,2000 在,crd,2000 在,PCL,2000 在,mtg,2000现在我将新生成的 2001 记录附加到 test.csv。将新数据附加到 test.csv 后,我的数据如下所示。
append.csv
country_code,product_code,rpt_period 我们,crd,2000 我们,PCL,2000 我们,mtg,2000 在,crd,2000 在,PCL,2000 在,mtg,2000 我们,crd,2001 我们,PCL,2001 我们,mtg,2001 在,crd,2001 在, pcl, 2001 在,mtg,2001蜂巢中可能出现以下情况?如果是,请回答问题。
- 如何使用此数据为分区表
Foo创建架构?还有我 希望分区列为 country_code 和 product_code。 - 例如,我想(从 test.csv 文件记录)加载到表
Foo?使用 hiveLOAD DATA命令? - 如何将 append.csv(仅 2001 条记录)加载到表
Foo。这也需要使用 hiveLOAD DATA命令来完成
谢谢。
【问题讨论】: