【发布时间】:2017-04-19 21:56:51
【问题描述】:
我寻求帮助。 我有一个数据库表,其中的帐户。有id,name等列。我需要找到名称相似的记录,以检查重复项。例如,我需要检查的帐户名称可以是 a.s. .: ABF a.s, ABF, a.s., "ABCD s.r.o", ABCD s.r.o, REWAQ a.s, REWAQ v.o.s.不同的可以是:、或“”或结尾(ABC s.r.o. / ABC v.o.s)。 该表有大约 150,000 个条目。可以进行查询,返回相似的帐户名称,我可以检查重复性? 我创建了这个问题,但我的子查询返回了多个值。
如果有任何建议,我将非常高兴。 谢谢, 马丁
【问题讨论】:
-
您尝试过简单的
count和group by吗?添加一个having来删除唯一的行也很好。 PS:重复条件不是很清楚 -
准确定义什么是“相似”。一旦你设法精确地定义了相似之处,你就会知道做到这一点是多么容易。 (剧透:你不会的。事实并非如此。)
-
是的,我试过了,但是count会返回数字,我需要返回类似帐户的全名
-
所以在
select中加上名字……既然是group by的子句,这样就对了