【发布时间】:2017-07-07 18:39:27
【问题描述】:
我现在在一个处理大数据的项目中工作。我们从客户那里获得大量数据,比如大约 600 万个数据,我们对其进行处理以对齐它们并填充空白空间并将其作为最终结果生成。
但是有必要检查我们在此过程中没有丢失任何数据或混淆数据。
所以故事就像在数据表中说表 1 我有两列 命名部分和客户端。我想与处理后的进行比较 数据表说表 2 的列 newpart 和 new clients。这里 数据不是必须按相同顺序排列的,表 2 也是如此 将添加其他列。
这里的问题是如何将这 600 万个数据进行比较以达到最高准确度?是否有任何开源工具可以做到这一点。 ?任何参考视频或日记?
【问题讨论】:
标签: javascript mysql sql datatable bigdata