Oracle의 테이블에서 중복 값을 어떻게 찾습니까?


276

주어진 열에 대한 중복 값과 Oracle 데이터베이스 테이블에서 발생 횟수를 반환하는 가장 간단한 SQL 문은 무엇입니까?

예를 들어 : JOBS열 이있는 테이블이 JOB_NUMBER있습니다. 중복이 있는지 어떻게 알 수 JOB_NUMBER있습니까? 복제 횟수는 몇 번입니까?


답변:


608
SELECT column_name, COUNT(column_name)
FROM table_name
GROUP BY column_name
HAVING COUNT(column_name) > 1;

1
고마워-그게 내가 찾은 대답이고 여기에 다시 게시하도록 나를 이겼다! : o)
Andrew

3
천만에요. 이제 count (column)과 count (*)의 차이점에 대한 내 자신의 질문을 게시하려고합니다. :)
Bill the Lizard

44
한 4 년 후, 여전히 잘 작동하고, 그가에 또한만큼 여러 열을 선택하기 위해 조정할 수 있습니다 group by같이 : select column_one, column_two, count(*) from tablename group by column_one, column_two having count(column_one) > 1;
아모스 M. 목수

4
또는 심지어 having count(*) > 1: D
Stanislav Mamontov

3
8 년이 지난 후에도 +1은 최신 버전의 Oracle과 MySQL 모두에 대해 여전히 잘 작동합니다 (회선 수에서 카운트 기능 후 공간 제거).
PhatHV

58

또 다른 방법:

SELECT *
FROM TABLE A
WHERE EXISTS (
  SELECT 1 FROM TABLE
  WHERE COLUMN_NAME = A.COLUMN_NAME
  AND ROWID < A.ROWID
)

에 인덱스가있을 때 잘 작동합니다 column_name. 중복 행을 삭제하거나 업데이트하는 것이 더 좋습니다.


3
+1은 여러 열에 대해 잘 작동합니다 (예 : 여러 열에 UNIQUE 제약 조건을 추가하려는 경우). 필요한 경우 중복 필드 값 + 다른 필드를 나열하기 위해이 방법이 GROUP BY보다 덜 "강성"하다는 것을 알았습니다.
Frosty Z

3
명확히하기 위해 (이것은 처음에는 나에게 분명하지 않았습니다)이 쿼리는 복제본 만 반환하고 첫 번째 원래 항목을 반환하지 않으므로 중복을 삭제하는 데 이상이 있습니다. 1 열. 이 쿼리에서 중복 ID를 선택한 다음이를 사용하여 중복 ID를 삭제할 수 있습니다.
matthewb

1
<를! =로 변경하면 중복되는 모든 레코드를 얻게됩니다. 두 번째 또는 세 번째 기록뿐만 아니라
moore1emu

33

내가 생각할 수있는 가장 간단한 :

select job_number, count(*)
from jobs
group by job_number
having count(*) > 1;

1
모든 열을 얻는 방법은 무엇입니까?
Asif Mushtaq

2
작업 선택 * 여기서 (job_number 갖는 카운트 (* 의한 작업 그룹에서 선택 job_number)> 1)에 job_number
JosephStyons

17

실제 중복 수를 알 필요가없는 경우 반환 된 열에 개수가 없어도됩니다. 예 :

SELECT column_name
FROM table
GROUP BY column_name
HAVING COUNT(*) > 1

7

어때요?

SELECT <column>, count(*)
FROM <table>
GROUP BY <column> HAVING COUNT(*) > 1;

위의 예에 답하면 다음과 같습니다.

SELECT job_number, count(*)
FROM jobs
GROUP BY job_number HAVING COUNT(*) > 1;

5

여러 열이 고유 행을 식별하는 경우 (예 : 관계 테이블) 다음을 사용할 수 있습니다.

행 ID를 사용하십시오. 예 : emp_dept (empid, deptid, startdate, enddate) empid와 deptid가 고유하다고 가정하고이 경우 행을 식별하십시오

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.rowid <> ied.rowid and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

그런 테이블에 기본 키가 있으면 rowid 대신 기본 키를 사용하십시오. 예를 들어 id는 pk입니다.

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.id <> ied.id and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

4

하기

select count(j1.job_number), j1.job_number, j1.id, j2.id
from   jobs j1 join jobs j2 on (j1.job_numer = j2.job_number)
where  j1.id != j2.id
group by j1.job_number

중복 된 행의 ID를 제공합니다.


4
SELECT   SocialSecurity_Number, Count(*) no_of_rows
FROM     SocialSecurity 
GROUP BY SocialSecurity_Number
HAVING   Count(*) > 1
Order by Count(*) desc 

2

나는 보통 Oracle Analytic 함수 ROW_NUMBER ()를 사용 합니다.

당신이 고유 인덱스 또는 열을 기반으로 기본 키를 (에 관한 한 당신 중복을 확인하고 싶은 말 c1, c2, c3). 그럼 당신은 양육이 길을 갈 것입니다 ROWID가져온 줄 수 행의들 ROW_NUMBER()입니다 >1:

Select * From Table_With_Duplicates
      Where Rowid In
                    (Select Rowid
                       From (Select Rowid,
                                    ROW_NUMBER() Over (
                                            Partition By c1 || c2 || c3
                                            Order By c1 || c2 || c3
                                        ) nbLines
                               From Table_With_Duplicates) t2
                      Where nbLines > 1)

1

이를 수행하기위한 SQL 요청은 다음과 같습니다.

select column_name, count(1)
from table
group by column_name
having count (column_name) > 1;

1

나는 오래된 실을 알고 있지만 이것이 도움이 될 수 있습니다.

아래에서 중복 사용을 확인하면서 테이블의 다른 열을 인쇄해야하는 경우 :

select * from table where column_name in
(select ing.column_name from table ing group by ing.column_name having count(*) > 1)
order by column_name desc;

필요한 경우 where 절에 필터를 추가 할 수도 있습니다.


0

1. 해결책

select * from emp
    where rowid not in
    (select max(rowid) from emp group by empno);

이 원본 포스터는 삭제를 언급 한 적이없고 계산
Jeff

-1

또한 u는 reqitem과 같은 테이블의 모든 중복 값을 나열하기 위해 이와 같은 것을 시도 할 수 있습니다

SELECT count(poid) 
FROM poitem 
WHERE poid = 50 
AND rownum < any (SELECT count(*)  FROM poitem WHERE poid = 50) 
GROUP BY poid 
MINUS
SELECT count(poid) 
FROM poitem 
WHERE poid in (50)
GROUP BY poid 
HAVING count(poid) > 1;
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.