【发布时间】:2012-02-17 02:53:59
【问题描述】:
我的数据库中有一个表来存储用户数据。我在将数据添加到此表数据库的代码中发现了一个缺陷,如果发生网络超时,代码会使用前一个用户的数据更新下一个用户的数据。我已经解决了这个缺陷,但我需要清理数据库。我添加了一个标志来指示需要忽略的行,我的目标是相应地标记这些标志以用于重复。但在某些情况下,重复值实际上可能是合法的,因此我更感兴趣的是找到具有相同数据的多个用户(即 u> 2)。
这是一个示例(表名 = 数据):
id---- user_id----data1----data2----data3----datetime-----------flag
1-----usr1--------3---------- 2---------2---------2012 -02-16..-----0
2-----usr2--------3---------- 2---------2---------2012 -02-16..-----0
3-----usr3--------3---------- 2---------2---------2012 -02-16..-----0
在这种情况下,我想将 1 和 2 id 标志标记为 1(表示忽略)。由于我们知道 usr1 是原始数据点(假设最早的日期在列表中较早)。
此时表格中有太多条目,我不确定识别具有重复条目的用户的最佳方法。
我正在寻找一个 mysql 命令来首先识别问题数据,然后我将能够标记条目。有人可以指导我正确的方向吗?
【问题讨论】:
标签: mysql duplicates