【发布时间】:2013-09-18 03:14:44
【问题描述】:
假设我有 2 个大型 csv 文件(超过 100 万行),两者都是具有排名的名称列表。目标是在两个列表中找到相同的名称,列表 1 中的唯一名称和列表 2 中的唯一名称。
我想这样做是 mySQL,所以我为每个列表创建了一个表,但是一百万次循环超过一百万条记录似乎是一种糟糕的方式,而且非常慢。你会怎么做呢?
这是一个示例但错误的查询:http://sqlfiddle.com/#!2/9f272/2
【问题讨论】:
-
所以您想要三个结果: 1.相同/相似的名称 2.) 1 中的唯一 3.) 2 中的唯一?相似是什么意思?
-
对不起,我的意思是一样不相似。
标签: mysql sql list csv dataset