【问题标题】:How do I find duplicate values in a table in Oracle?如何在 Oracle 的表中查找重复值?
【发布时间】:2010-09-08 17:21:31
【问题描述】:

返回给定列的重复值以及它们在 Oracle 数据库表中出现次数的最简单 SQL 语句是什么?

例如:我有一个JOBS 表,其中包含JOB_NUMBER 列。如何确定我是否有任何重复的 JOB_NUMBERs,以及它们重复了多少次?

【问题讨论】:

标签: sql oracle duplicate-data


【解决方案1】:

按 COUNT 聚合列,然后使用 HAVING 子句查找出现大于一次的值。

SELECT column_name, COUNT(column_name)
FROM table_name
GROUP BY column_name
HAVING COUNT(column_name) > 1;

【讨论】:

  • 谢谢 - 这就是我刚刚找到的答案,你打败了我把它发回这里! :o)
  • 不客气。现在我要发布我自己关于count(column) 和count(*) 之间差异的问题。 :)
  • +1 4 年后,仍然运行良好,并且可以调整以选择多个列,只要它们也在 group by 中,如:select column_one, column_two, count(*) from tablename group by column_one, column_two having count(column_one) > 1; 等。
  • 甚至having count(*) > 1 :D
  • +1 超过 8 年后,仍然适用于最新版本的 Oracle 和 MySQL(在有行的 count 函数后删除空格)。
【解决方案2】:

另一种方式:

SELECT *
FROM TABLE A
WHERE EXISTS (
  SELECT 1 FROM TABLE
  WHERE COLUMN_NAME = A.COLUMN_NAME
  AND ROWID < A.ROWID
)

column_name 上有索引时工作正常(足够快)。这是删除或更新重复行的更好方法。

【讨论】:

  • +1 适用于多列重复项(例如,当您想在多列上添加 UNIQUE 约束时),我发现这种方法比 GROUP BY one 列出重复字段更“刚性”如果需要,值 + 其他字段。
  • 澄清一下,(起初这对我来说并不明显)这个查询只返回重复项,它不返回第一个原始条目,这就是为什么它可以很好地删除重复项,基于超过 1 列的唯一约束。您可以使用此查询选择重复的 ID,然后使用它们删除重复的 ID。
  • 如果您将
【解决方案3】:

我能想到的最简单的:

select job_number, count(*)
from jobs
group by job_number
having count(*) > 1;

【讨论】:

  • 如何获取所有列?
  • select * from jobs where job_number in(select job_number from jobs group by job_number with count(*) > 1)
  • 最喜欢的解决方案...而不是记住..我总是喜欢复制..谢谢@jo
  • @StartCoding,感谢您的反馈。很高兴它对您有用。
【解决方案4】:

如果您不需要知道重复的实际数量,您甚至不需要在返回的列中包含计数。例如

SELECT column_name
FROM table
GROUP BY column_name
HAVING COUNT(*) > 1

【讨论】:

    【解决方案5】:

    怎么样:

    SELECT <column>, count(*)
    FROM <table>
    GROUP BY <column> HAVING COUNT(*) > 1;
    

    要回答上面的例子,它看起来像:

    SELECT job_number, count(*)
    FROM jobs
    GROUP BY job_number HAVING COUNT(*) > 1;
    

    【讨论】:

      【解决方案6】:

      如果多列标识唯一行(例如关系表),您可以使用以下

      使用行 ID 例如emp_dept(empid,deptid,开始日期,结束日期) 假设 empid 和 deptid 是唯一的并且在这种情况下识别行

      select oed.empid, count(oed.empid) 
      from emp_dept oed 
      where exists ( select * 
                     from  emp_dept ied 
                      where oed.rowid <> ied.rowid and 
                             ied.empid = oed.empid and 
                            ied.deptid = oed.deptid )  
              group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);
      

      如果这样的表有主键,则使用主键而不是 rowid,例如 id 是 pk 那么

      select oed.empid, count(oed.empid) 
      from emp_dept oed 
      where exists ( select * 
                     from  emp_dept ied 
                      where oed.id <> ied.id and 
                             ied.empid = oed.empid and 
                            ied.deptid = oed.deptid )  
              group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);
      

      【讨论】:

        【解决方案7】:

        在做

        select count(j1.job_number), j1.job_number, j1.id, j2.id
        from   jobs j1 join jobs j2 on (j1.job_numer = j2.job_number)
        where  j1.id != j2.id
        group by j1.job_number
        

        将为您提供重复行的 ID。

        【讨论】:

          【解决方案8】:
          SELECT   SocialSecurity_Number, Count(*) no_of_rows
          FROM     SocialSecurity 
          GROUP BY SocialSecurity_Number
          HAVING   Count(*) > 1
          Order by Count(*) desc 
          

          【讨论】:

            【解决方案9】:

            我通常使用Oracle Analytic函数ROW_NUMBER()

            假设您要检查有关在列上构建的唯一索引或主键的重复项(c1c2c3)。 然后你会走这条路,调出 ROWID 的行,其中ROW_NUMBER() 带来的行数是&gt;1

            Select * From Table_With_Duplicates
                  Where Rowid In
                                (Select Rowid
                                   From (Select Rowid,
                                                ROW_NUMBER() Over (
                                                        Partition By c1 || c2 || c3
                                                        Order By c1 || c2 || c3
                                                    ) nbLines
                                           From Table_With_Duplicates) t2
                                  Where nbLines > 1)
            

            【讨论】:

              【解决方案10】:

              我知道它是一个旧线程,但这可能会对某些人有所帮助。

              如果您需要在下面检查重复使用时打印表格的其他列:

              select * from table where column_name in
              (select ing.column_name from table ing group by ing.column_name having count(*) > 1)
              order by column_name desc;
              

              如果需要,还可以在 where 子句中添加一些额外的过滤器。

              【讨论】:

                【解决方案11】:

                这是一个执行此操作的 SQL 请求:

                select column_name, count(1)
                from table
                group by column_name
                having count (column_name) > 1;
                

                【讨论】:

                  【解决方案12】:

                  1.解决方案

                  select * from emp
                      where rowid not in
                      (select max(rowid) from emp group by empno);
                  

                  【讨论】:

                  • 这个原帖没提删,只算数
                  【解决方案13】:

                  你也可以尝试这样的事情来列出表格中的所有重复值,比如 reqiitem

                  SELECT count(poid) 
                  FROM poitem 
                  WHERE poid = 50 
                  AND rownum < any (SELECT count(*)  FROM poitem WHERE poid = 50) 
                  GROUP BY poid 
                  MINUS
                  SELECT count(poid) 
                  FROM poitem 
                  WHERE poid in (50)
                  GROUP BY poid 
                  HAVING count(poid) > 1;
                  

                  【讨论】:

                    猜你喜欢
                    • 2021-06-20
                    • 2021-09-02
                    • 1970-01-01
                    • 2018-06-29
                    • 1970-01-01
                    • 1970-01-01
                    • 2016-08-03
                    • 2020-10-09
                    • 1970-01-01
                    相关资源
                    最近更新 更多