【发布时间】:2020-12-10 06:50:31
【问题描述】:
我们有一个用例,我们需要以汇总的方式比较两个数据库(Oracle 和 AWS Redshift)之间的 100 个表
这些表是相同的,我们需要知道这些表是否匹配。让我知道是否有任何简单的方法可以高效地比较数据
【问题讨论】:
标签: python sql database compare
我们有一个用例,我们需要以汇总的方式比较两个数据库(Oracle 和 AWS Redshift)之间的 100 个表
这些表是相同的,我们需要知道这些表是否匹配。让我知道是否有任何简单的方法可以高效地比较数据
【问题讨论】:
标签: python sql database compare
我为此开发的最佳方法是对两个数据库中每个表中的每一列进行 md5 签名并比较这些签名(或者只是组合列签名来制作表签名)。我不得不进行一些编码,以确保 NULL 和空字符串错误比较并处理其他一些极端情况,但不要太极端。
Redshift 可以非常快速地执行这种签名分析,但我过去遇到的最大问题是其他数据库计算签名的速度。正如你所问的“以一种高效的方式”。因此,在过去,当源数据库太弱而无法计算大量 md5 时,我不得不编写“轻量级”哈希函数。
【讨论】: