【发布时间】:2020-06-27 04:02:39
【问题描述】:
基本上我有 3 个输入文件,我需要使用 ODI 将 3 个输入文件合并到 Hive。
文件 1: 帐号、姓名、地址
文件 2: AcctNo,Block_Code,Block_Date
文件 3: AcctNo,Balance1,Balance2
蜂巢: AcctNo,Name,Address,Block_Code,Block_Date,Balance1,Balance2
我对 Hadoop 还是很陌生,在没有接受过 Oracle 数据集成适当培训的情况下被投入到这个项目中,我读到 Hive 本身不支持更新,但可以启用 ACID 事务。
由于我的组织使用 ODI 作为主要的数据集成工具,我需要在 ODI 中完成,谁能告诉我这可以在 1 次 ETL 中完成吗?
我想先在不合并的情况下从文件到 Hive 进行 ETL,然后只在 HIVE 中进行合并,这似乎很耗时。我想知道有没有更好的方法来做到这一点?
【问题讨论】: