【发布时间】:2021-08-07 14:31:49
【问题描述】:
我有一个用例,我必须合并来自 2 个表(位于不同数据源中)的数据。 考虑每个表都有员工数据(名字、姓氏、电话号码)。对于每个员工,我必须合并两个表中的 phoneNumber 数据,其他数据将保持与表 1 中的相同
- 如果表 1 和表 2 中都存在员工数据,则 phoneNumber 数据将合并为逗号分隔值,其他数据将来自表 1
- 如果员工仅出现在表 1 中,则整个数据将来自表 1
- 如果员工只出现在表 2 中,那么整个数据将来自表 2
这些表每个都有大约 40 行缺少数据。接近 5GB。 在 Java 中执行此操作的最佳方法是什么?我担心的是,如果我将这 2 个表中的数据提取到 Java 缓存中,我仍然需要循环考虑整个表 2 以查看那里是否还有员工。 还是python脚本会更好?
表 1
| EmployeeID | FirstName | LastName | PhoneNumber |
|---|---|---|---|
| EM01 | Jhon | Doe | 12345 |
| EM02 | Dave | Joe | 34567 |
表 2:
| EmployeeID | FirstName | LastName | PhoneNumber |
|---|---|---|---|
| EM01 | Jhon | Doe | 89000 |
| EM03 | Gabe | Mai | 45678 |
表3(合并电话号码后):
| EmployeeID | FirstName | LastName | PhoneNumber |
|---|---|---|---|
| EM01 | Jhon | Doe | 12345,89000 |
| EM02 | Dave | Joe | 34567 |
| EM03 | Gabe | Mai | 45678 |
【问题讨论】:
标签: java python mysql sql caching