【发布时间】:2012-12-21 21:33:47
【问题描述】:
我有一个大约 10 毫米散列的数据集。我需要允许人们将哈希列表与那些进行比较,以查看它们是否匹配。现在我们使用 sql 并基本上扫描它以查找猜测数组中的每个项目。这适用于大约 10K,但用户需要检查更大的集合,例如 200K 散列与 10mm 散列的字典
在 sql 或 nosql 或其他方面可能是一个好的方法
--
对于意图的上下文,我们管理一个选择退出列表,并允许营销经理上传一份针对它的工作表,我们会返回一个干净且无邮件的文件。
【问题讨论】:
-
“10mm”是什么意思? 1000 万还是 1000 万(=10 万亿)?
-
你打算在什么语言/操作系统上运行它?
-
马特 - 任何语言都可以
-
Philipp - 10mm 意味着 1000 万,奇怪的习惯,谢谢你让我谷歌它
标签: sql-server nosql bigdata