SQL에서 임의의 행을 요청하는 방법은 무엇입니까?

510

순수 SQL에서 임의의 행을 요청하거나 가능한 한 임의의 행에 가깝게 요청하려면 어떻게해야합니까?

sql random

— 스 베르 레호
소스

나는 항상 SQL에서 쿼리 결과 후 PHP 에서이 작업을 수행 ... 솔루션의 한계 1 추가에 따라 처리하는 것이 훨씬 빠릅니다

— CheeseConQueso

SQL Server 인 경우 불필요한 정렬을 피하기 위해 CLR 집계를 사용할 수 있습니다

— Martin Smith

2

모든 dbms에서 실행되는 "순수한 SQL"솔루션이없는 것 같습니다 ... 각각에 대한 솔루션이 있습니다.

— Manu

성능 버전 : stackoverflow.com/questions/4329396/…

— Ciro Santilli 郝海东冠状病六四事件法轮功

735

이 게시물을 참조하십시오 : 데이터베이스 테이블에서 임의의 행을 선택하는 SQL . MySQL, PostgreSQL, Microsoft SQL Server, IBM DB2 및 Oracle 에서이 작업을 수행하는 방법을 안내합니다 (다음은 해당 링크에서 복사 됨).

MySQL로 임의의 행을 선택하십시오.

SELECT column FROM table
ORDER BY RAND()
LIMIT 1

PostgreSQL로 임의의 행을 선택하십시오.

SELECT column FROM table
ORDER BY RANDOM()
LIMIT 1

Microsoft SQL Server에서 임의의 행을 선택하십시오.

SELECT TOP 1 column FROM table
ORDER BY NEWID()

IBM DB2로 임의의 행을 선택하십시오.

SELECT column, RAND() as IDX 
FROM table 
ORDER BY IDX FETCH FIRST 1 ROWS ONLY

Oracle에서 무작위 레코드를 선택하십시오.

SELECT column FROM
( SELECT column FROM table
ORDER BY dbms_random.value )
WHERE rownum = 1

— 야 코브 엘리스
소스

30

order by rand()모든 db 에 의존 하거나 그에 상응 하는 경우 -1 : |. 또한 여기에 언급했다 .

— AD7six

20

10 년 전 어떤 사람은 사용 ORDER BY RAND()이 잘못되었다고 말했습니다 .

— trejder

SQL Server에서 ORDER BY NEWID ()가 현저히 느려집니다. 내 쿼리는 다음과 같습니다. 고객 C 내부 조인에서 상위 1000 C.CustomerId, CL.LoginName을 선택하십시오 .C.CustomerId = LA.CustomerId 내부 조인 LinkedAccount LA C. NEWID ()에 의해 count (*)> 1 순서를 가진 LoginName "order by NEWID ()"행을 제거하면 결과가 훨씬 빨라집니다.

— 벤 파워

3

SQLite의 경우 RANDOM () 함수를 사용하십시오.

— Slam

10

이러한 솔루션은 확장되지 않습니다. 그들은이다 O(n)와 n테이블의 레코드 수있는. 백만 개의 레코드가 있다고 상상해보십시오. 정말로 백만 개의 난수 또는 고유 ID를 생성하고 싶습니까? 차라리 단일 난수를 사용하는 COUNT()새로운 LIMIT표현식 에 사용 하고 관련 시킵니다.

— Christian Hujer

174

Jeremies와 같은 솔루션 :

SELECT * FROM table ORDER BY RAND() LIMIT 1

작동하지만 모든 테이블을 순차적으로 스캔해야합니다 (각 행과 관련된 임의의 값을 계산해야하므로 가장 작은 값을 결정할 수 있기 때문에). 중형 테이블의 경우 상당히 느릴 수 있습니다. 내 권장 사항은 일종의 색인 된 숫자 열 (많은 테이블이 기본 키로 사용)을 사용하고 다음과 같이 작성하는 것입니다.

SELECT * FROM table WHERE num_value >= RAND() * 
    ( SELECT MAX (num_value ) FROM table ) 
ORDER BY num_value LIMIT 1

num_value인덱스 된 경우 테이블 크기에 관계없이 로그 시간으로 작동합니다 . 한 가지주의 사항 : 이것은 num_value범위에 균등하게 분포되어 있다고 가정합니다 0..MAX(num_value). 데이터 세트가이 가정에서 크게 벗어나면 결과가 왜곡됩니다 (일부 행은 다른 행보다 더 자주 나타남).

— 그레이 팬더
소스

8

두 번째 제안은 무작위가 아닙니다. 선택 될 행을 예측할 수 없지만 내기를해야하는 경우 두 번째 행에 베팅합니다. 그리고 당신은 마지막 행에 결코 내기하지 않을 것입니다, 그것은 당신의 num_value의 분포와 테이블의 크기가 무엇이든 선택 될 가능성이 적습니다.

— 에티엔 느 라 시네

1

나는 일반적으로 RAND () 함수의 품질이 좋지 않다는 것을 알고 있지만 그 외에는 선택이 무작위가 아닌 이유를 자세히 설명해 주시겠습니까?

— 그레이 팬더

13

첫 번째는 SQL Server에서 잘못되었습니다. RAND () 함수는 행당 한 번이 아니라 쿼리 당 한 번만 호출됩니다. 따라서 항상 첫 번째 행을 선택합니다 (시도).

— Jeff Walker 코드 레인저

3

두 번째 행은 또한 모든 행이 설명 된 것으로 가정합니다. 삭제 된 행을 선택할 수 있습니다.

— Sam Rueby

3

@ Sam.Rueby 실제로, num_value> = RAND () ... 한계 1은 기존 행을 찾을 때까지 빈 행을 건너 뛰도록합니다.

— ghord

62

이것이 얼마나 효율적인지 모르겠지만 전에 사용했습니다.

SELECT TOP 1 * FROM MyTable ORDER BY newid()

GUID는 매우 임의적이므로 순서는 임의의 행을 얻는 것을 의미합니다.

— 맷 해밀턴
소스

1

나는 MS SQL 서버를 사용하고 있습니다. SELECT TOP 1 * FROM some_table_name ORDER BY NEWID ()는 조언을 주셔서 감사합니다.

즉 정확히 같은 일을이다ORDER BY RAND() LIMIT 1

— 켄 블룸

6

그것은 사용하기 때문에이 또한 매우 데이터베이스의 특정 TOP 1와 newid().

— 그레이

12

이것은 나쁜 생각입니다. 이 방법은 각 열이 개별적으로 색인되지 않으면 색인을 사용하지 않습니다. 1 억 개의 레코드가있는 테이블은 하나의 레코드를 얻는 데 시간이 오래 걸릴 수 있습니다.

— 전환

1

@ 스위치와 어떤 솔루션을 제안 하시겠습니까?

— Akmal Salikhov

31

ORDER BY NEWID()

소요 7.4 milliseconds

WHERE num_value >= RAND() * (SELECT MAX(num_value) FROM table)

걸립니다 0.0065 milliseconds!

나는 후자의 방법으로 분명히 갈 것입니다.

— 닐
소스

2

두 번째 옵션은 마지막 행을 선택하지 않습니다. 이유를 모르겠습니다-그냥 지적하십시오.

— Voldemort

7

@Voldemort : 여기서 rand()부동 소수점 숫자를 반환합니다 . 정수 라고 가정하면 의 반환 값 도 정수로 강제 변환되므로 소수점 뒤의 항목이 잘립니다. 따라서 됩니다 항상 미만 마지막 행이 선택되지 않습니다 이유입니다. n0 < n < 1num_valuerand() * max(num_value)rand() * max(num_value)max(num_value)

— Ian Kemp

데이터가 자주 삭제되면 효율적이지 않습니다. 간격을 찾으면 전체 쿼리를 다시 실행해야합니다.

— Loic Coenen

1

@IanKemp 어리석은 질문이므로 SELECT MAX (num_value) + 1을 사용하지 않는 이유는 무엇입니까 ?? rand (또는 대부분의 경우 RANDOM)는 [0,1)을 반환하므로 전체 범위의 값을 얻을 수 있습니다. 또한, 맞습니다. 질의를 수정해야합니다.

— tekHedd

13

어떤 서버를 사용하고 있는지 말하지 않았습니다. 이전 버전의 SQL Server에서는 다음을 사용할 수 있습니다.

select top 1 * from mytable order by newid()

SQL Server 2005 이상에서는 TABLESAMPLE반복 가능한 임의의 샘플을 얻는 데 사용할 수 있습니다 .

SELECT FirstName, LastName
FROM Contact 
TABLESAMPLE (1 ROWS) ;

— 존 갤러웨이
소스

9

MSDN은 NEWID ()가 진정으로 무작위 결과를 TABLESAMPLE 선호하고 있다고 : msdn.microsoft.com/en-us/library/ms189108.aspx

— 앤드류 헤지스

7

앤드류 헤지스는 : NEWID () BY ORDER 너무 costful입니다

— 안드레이 Rînea

10

SQL Server의 경우

newid () / order by는 작동하지만 모든 행에 대해 id를 생성 한 다음 정렬해야하기 때문에 큰 결과 집합에는 비용이 많이 듭니다.

TABLESAMPLE ()은 성능 관점에서는 좋지만 결과가 뭉치 게됩니다 (페이지의 모든 행이 반환 됨).

더 나은 성능의 실제 무작위 샘플을 얻으려면 가장 좋은 방법은 행을 무작위로 필터링하는 것입니다. SQLS 온라인 설명서의 TABLESAMPLE을 사용하여 결과 집합 제한 에서 다음 코드 샘플을 찾았습니다 .

실제로 개별 행의 임의 샘플을 원하면 TABLESAMPLE을 사용하는 대신 무작위로 행을 필터링하도록 쿼리를 수정하십시오. 예를 들어 다음 쿼리는 NEWID 함수를 사용하여 Sales.SalesOrderDetail 테이블 행의 약 1 %를 반환합니다.
SELECT * FROM Sales.SalesOrderDetail
WHERE 0.01 >= CAST(CHECKSUM(NEWID(),SalesOrderID) & 0x7fffffff AS float)
              / CAST (0x7fffffff AS int)
SalesOrderID 열은 CHECKSUM 표현식에 포함되므로 NEWID ()가 행당 한 번 평가되어 행별로 샘플링을 수행 할 수 있습니다. CAST (CHECKSUM (NEWID (), SalesOrderID) & 0x7fffffff AS float / CAST (0x7fffffff AS int) 식은 0과 1 사이의 임의의 부동 소수점 값으로 평가됩니다.

1,000,000 개의 행이있는 테이블에 대해 실행할 때 내 결과는 다음과 같습니다.

SET STATISTICS TIME ON
SET STATISTICS IO ON

/* newid()
   rows returned: 10000
   logical reads: 3359
   CPU time: 3312 ms
   elapsed time = 3359 ms
*/
SELECT TOP 1 PERCENT Number
FROM Numbers
ORDER BY newid()

/* TABLESAMPLE
   rows returned: 9269 (varies)
   logical reads: 32
   CPU time: 0 ms
   elapsed time: 5 ms
*/
SELECT Number
FROM Numbers
TABLESAMPLE (1 PERCENT)

/* Filter
   rows returned: 9994 (varies)
   logical reads: 3359
   CPU time: 641 ms
   elapsed time: 627 ms
*/    
SELECT Number
FROM Numbers
WHERE 0.01 >= CAST(CHECKSUM(NEWID(), Number) & 0x7fffffff AS float) 
              / CAST (0x7fffffff AS int)

SET STATISTICS IO OFF
SET STATISTICS TIME OFF

TABLESAMPLE을 사용하여 벗어날 수 있다면 최상의 성능을 제공합니다. 그렇지 않으면 newid () / filter 메소드를 사용하십시오. 결과 세트가 큰 경우 newid () / order by를 최후의 수단으로 사용해야합니다.

— 롭 보크
소스

4

가능하면, 저장된 명령문을 사용하여 RND ()에 대한 두 인덱스의 비 효율성을 피하고 레코드 번호 필드를 작성하십시오.

PREPARE RandomRecord FROM "SELECT * FROM table LIMIT?, 1";
SET @ n = FLOOR (RAND () * (SELECT COUNT (*) FROM 테이블));
EXECUTE RandomRecord USING @n;

— ldrut
소스

이 솔루션은 위의 where 절에 사용 된 색인화 된 숫자 값이 균등하게 분산되지 않은 경우 임의의 행을 반환합니다. 따라서 id_value> = RAND () * MAX (id_value)를 사용하는 것과 거의 동일한 (일정한) 시간이 걸리더라도 더 좋습니다.

— guido

내가 일정한 시간에 실행되지 않는다는 것을 알 수있는 한 선형 시간으로 실행됩니다. 최악의 경우 @n은 테이블의 행 수와 같으며 "SELECT * FROM table LIMIT?, 1"은 마지막 행에 도달 할 때까지 @n-1 개의 행을 평가합니다.

— Andres Riofrio

3

가장 좋은 방법은 그 목적을 위해 새로운 열에 임의의 값을 넣고 다음과 같은 것을 사용하는 것입니다 (의사 코드 + SQL).

randomNo = random()
execSql("SELECT TOP 1 * FROM MyTable WHERE MyTable.Randomness > $randomNo")

이것이 MediaWiki 코드에 의해 채택 된 솔루션입니다. 물론 더 작은 값에 대해서는 약간의 편견이 있지만 행을 가져 오지 않을 때 임의의 값을 0으로 감싸는 것으로 충분하다는 것을 알았습니다.

newid () 솔루션은 각 행에 새 guid를 할당 할 수 있도록 전체 테이블 스캔이 필요할 수 있으며, 성능이 훨씬 떨어집니다.

rand () 솔루션은 함수가 한 번만 평가되고 모든 행에 동일한 "임의"번호가 할당 되므로 MSSQL에서는 전혀 작동하지 않을 수 있습니다.

— 이스마엘
소스

1

0 개의 결과를 얻었을 때 래핑하면 "충분히 좋은"것이 아닌 무작위 샘플이 제공됩니다. 이 솔루션 은 거의 다중 행 쿼리로 확장됩니다 ( "파티 셔플"을 생각하십시오). 문제는 동일한 그룹에서 결과가 반복적으로 선택되는 경향이 있다는 것입니다. 이 문제를 해결하려면 방금 사용한 난수를 재분배해야합니다. randomNo를 추적하고 결과에서 max (randomness)로 설정하여 속임수를 쓸 수 있지만 p (조회 1의 행 i와 조회 2의 행 i) == 0으로, 이는 공평하지 않습니다. 몇 가지 수학을하겠습니다. 진정으로 공정한 계획으로 다시 연락 드리겠습니다.

— 9

3

SQL Server 2005 및 2008의 경우 ( Books Online의 ) 개별 행의 임의 샘플을 원할 경우 :

SELECT * FROM Sales.SalesOrderDetail
WHERE 0.01 >= CAST(CHECKSUM(NEWID(), SalesOrderID) & 0x7fffffff AS float)
/ CAST (0x7fffffff AS int)

— 산티아고 세 파스
소스

3

권장되지 않는 RAND () 를 사용 하면 max ID (= Max)를 얻을 수 있습니다.

SELECT MAX(ID) FROM TABLE;

1..Max (= My_Generated_Random) 사이에서 임의의 값을 얻습니다.

My_Generated_Random = rand_in_your_programming_lang_function(1..Max);

그런 다음이 SQL을 실행하십시오.

SELECT ID FROM TABLE WHERE ID >= My_Generated_Random ORDER BY ID LIMIT 1

ID가 선택된 값보다 같거나 높은 행을 확인합니다. 테이블에서 행을 찾아 내고 My_Generated_Random보다 같거나 낮은 ID를 얻은 다음 쿼리를 다음과 같이 수정할 수도 있습니다.

SELECT ID FROM TABLE WHERE ID <= My_Generated_Random ORDER BY ID DESC LIMIT 1

— 포스 버그
소스

생성 된 임의의 ID가 더 이상 테이블에 없으면 어떻게됩니까? 사용자에게 표시하고 싶지 않은 삭제되거나 수동적 인 행은 문제를 일으킬 수 있습니다.

— Ebleme

아무것도. 정확한 번호가 아닌 가장 가까운 번호를 얻습니다. id = 1이 제거되었다고 생각되면 1을 최소로 교환하십시오.

— forsberg

2

@ cnu의 답변에 대한 @BillKarwin의 의견에서 지적했듯이 ...

LIMIT와 결합 할 때 실제 행을 직접 정렬하는 대신 임의의 순서로 JOIN하는 것이 훨씬 더 우수합니다 (적어도 PostgreSQL 9.1에서는).

SELECT * FROM tbl_post AS t
JOIN ...
JOIN ( SELECT id, CAST(-2147483648 * RANDOM() AS integer) AS rand
       FROM tbl_post
       WHERE create_time >= 1349928000
     ) r ON r.id = t.id
WHERE create_time >= 1349928000 AND ...
ORDER BY r.rand
LIMIT 100

'r'은 복합 쿼리에서 가능한 모든 키 값에 대해 'rand'값을 생성해야합니다.이 값은 조인되지만 가능한 경우 여전히 'r'의 행 수를 제한합니다.

정수형 CAST는 특히 정수 및 단 정밀도 부동 유형에 대한 특정 정렬 최적화 기능이있는 PostgreSQL 9.2에 유용합니다.

— 카르마 카제
소스

1

여기에있는 대부분의 솔루션은 정렬을 피하기위한 것이지만 여전히 테이블을 순차적으로 스캔해야합니다.

인덱스 스캔으로 전환하여 순차 스캔을 피하는 방법도 있습니다. 임의의 행의 인덱스 값을 알고 있으면 거의 즉시 결과를 얻을 수 있습니다. 문제는 인덱스 값을 추측하는 방법입니다.

다음 솔루션은 PostgreSQL 8.4에서 작동합니다.

explain analyze select * from cms_refs where rec_id in 
  (select (random()*(select last_value from cms_refs_rec_id_seq))::bigint 
   from generate_series(1,10))
  limit 1;

위의 솔루션은 0 범위에서 10 개의 다양한 임의 인덱스 값을 추측합니다. [마지막 id 값].

숫자 10은 임의적입니다. 100 또는 1000은 응답 시간에 큰 영향을 미치지 않으므로 100 또는 1000을 사용할 수 있습니다.

한 가지 문제가 있습니다. 스파 스 ID가 있으면 놓칠 수 있습니다 . 해결책은 백업 계획을 세우는 것입니다 .이 경우 random () 쿼리에 의한 순수한 오래된 순서입니다. 결합 된 id는 다음과 같습니다.

explain analyze select * from cms_refs where rec_id in 
    (select (random()*(select last_value from cms_refs_rec_id_seq))::bigint 
     from generate_series(1,10))
    union all (select * from cms_refs order by random() limit 1)
    limit 1;

UNION ALL 절이 아닙니다 . 이 경우 첫 번째 부분이 데이터를 반환하면 두 번째 부분은 절대 실행되지 않습니다!

— 헤 게몬
소스

1

늦었지만 Google을 통해 여기에 왔으므로 후손을 위해 대체 솔루션을 추가하겠습니다.

또 다른 방법은 번갈아 가면서 TOP을 두 번 사용하는 것입니다. TOP에서 변수를 사용하기 때문에 "순수 SQL"인지는 모르겠지만 SQL Server 2008에서는 작동합니다. 다음은 임의 단어를 원할 경우 사전 단어 표에 대해 사용하는 예입니다.

SELECT TOP 1
  word
FROM (
  SELECT TOP(@idx)
    word 
  FROM
    dbo.DictionaryAbridged WITH(NOLOCK)
  ORDER BY
    word DESC
) AS D
ORDER BY
  word ASC

물론 @idx는 대상 테이블에서 1부터 COUNT (*)까지의 임의 생성 정수입니다. 열의 색인이 생성 된 경우에도 이점이 있습니다. 또 다른 장점은 NEWID ()가 허용되지 않기 때문에 함수에서 사용할 수 있다는 것입니다.

마지막으로, 위의 쿼리는 같은 테이블에서 NEWID () 유형의 쿼리 실행 시간의 약 1/10에서 실행됩니다. YYMV.

— 알파 독
소스

1

new id()기능을 사용해보십시오 .

검색어를 작성하고 new id()기능별 순서를 사용하십시오 . 꽤 무작위입니다.

— 재이-gotaninterviewcall
소스

1

MySQL이 임의의 레코드를 가져 오려면

 SELECT name
  FROM random AS r1 JOIN
       (SELECT (RAND() *
                     (SELECT MAX(id)
                        FROM random)) AS id)
        AS r2
 WHERE r1.id >= r2.id
 ORDER BY r1.id ASC
 LIMIT 1

자세한 내용은 http://jan.kneschke.de/projects/mysql/order-by-rand/

— 소피
소스

많은 답변을 테스트 한 후 이것이 가장 좋은 답변이라고 생각합니다. 빠를 것 같고 매번 좋은 난수를 선택합니다. 위의 @GreyPanther의 두 번째 제안과 비슷하지만이 답변은 더 많은 난수를 선택합니다.

— Jeff Baker

1

아직 답변 에서이 변형을 보지 못했습니다. 매번 동일한 행 집합을 선택하기 위해 초기 시드가 주어지면 추가 제약이있었습니다.

MS SQL의 경우 :

최소 예 :

select top 10 percent *
from table_name
order by rand(checksum(*))

정규화 된 실행 시간 : 1.00

NewId () 예제 :

select top 10 percent *
from table_name
order by newid()

정규화 된 실행 시간 : 1.02

NewId()보다 훨씬 느리 rand(checksum(*))므로 큰 레코드 세트에 사용하지 않을 수 있습니다.

초기 종자를 사용한 선택 :

declare @seed int
set @seed = Year(getdate()) * month(getdate()) /* any other initial seed here */

select top 10 percent *
from table_name
order by rand(checksum(*) % seed) /* any other math function here */

시드가 지정된 동일한 세트를 선택 해야하는 경우 작동하는 것 같습니다.

— 클라이드
소스

1

MSSQL에서 (11.0.5569에서 테스트)

SELECT TOP 100 * FROM employee ORDER BY CRYPT_GEN_RANDOM(10)

보다 훨씬 빠르다

SELECT TOP 100 * FROM employee ORDER BY NEWID()

— 데이비드 나이트
소스

1

SQL Server에서는 TABLESAMPLE을 NEWID ()와 결합하여 꽤 좋은 임의성을 확보하고 여전히 속도를 유지할 수 있습니다. 이것은 실제로 1 또는 적은 수의 행만 원하는 경우에 특히 유용합니다.

SELECT TOP 1 * FROM [table] 
TABLESAMPLE (500 ROWS) 
ORDER BY NEWID()

— 크리스 아보 가스트
소스

1

SQL Server 2012+에서는 OFFSET FETCH 쿼리 를 사용하여 단일 임의 행에 대해이 작업을 수행 할 수 있습니다.

select  * from MyTable ORDER BY id OFFSET n ROW FETCH NEXT 1 ROWS ONLY

여기서 id는 식별 열이고 n은 원하는 행입니다. 테이블의 0과 count ()-1 사이의 난수로 계산됩니다 (오프셋 0은 결국 첫 번째 행).

ORDER BY 절에 대해 작업 할 인덱스가 있으면 테이블 데이터의 구멍에 대해 작업합니다. 그것은 또한 무작위성에 매우 좋습니다-당신이 스스로 통과하도록 노력하지만 다른 방법의 틈새는 존재하지 않습니다. 또한 성능은 꽤 좋으며 작은 데이터 세트에서는 잘 유지되지만 수백만 행에 대해 심각한 성능 테스트를 시도하지는 않았습니다.

— bj
소스

0

 SELECT * FROM table ORDER BY RAND() LIMIT 1

— 제레미 루튼
소스

10 년 전 (2005) 어떤 사람 은 사용 ORDER BY RAND()이 잘못되었다고 말했다 .

— trejder

0

CD-MaN에 동의해야합니다. "ORDER BY RAND ()"를 사용하면 작은 테이블이나 SELECT를 몇 번만 수행 할 때 잘 작동합니다.

또한 "num_value> = RAND () * ..."기술을 사용하며, 실제로 임의의 결과를 원하면 테이블에 하루에 한 번 정도 업데이트되는 특수한 "무작위"열이 있습니다. 단일 UPDATE 실행에는 다소 시간이 걸리지 만 (특히 해당 열에 인덱스가 있어야하기 때문에) 선택이 실행될 때마다 모든 행에 대해 임의의 숫자를 만드는 것보다 훨씬 빠릅니다.

— BlaM
소스

0

TableSample은 실제로 임의의 행 샘플을 반환하지 않으므로주의하십시오. 쿼리가 행을 구성하는 8KB 페이지의 임의 샘플을 보도록 지시합니다. 그런 다음이 페이지에 포함 된 데이터에 대해 쿼리가 실행됩니다. 이러한 페이지에서 데이터를 그룹화하는 방법 (삽입 순서 등)으로 인해 실제로 임의 샘플이 아닌 데이터가 발생할 수 있습니다.

참조 : http://www.mssqltips.com/tip.asp?tip=1308

이 TableSample의 MSDN 페이지에는 실제로 임의의 데이터 샘플을 생성하는 방법에 대한 예가 포함되어 있습니다.

http://msdn.microsoft.com/en-us/library/ms189108.aspx

— 숀 터너
소스

0

나열된 많은 아이디어가 여전히 주문을 사용하는 것 같습니다

그러나 임시 테이블을 사용하는 경우 많은 솔루션에서 제안한 것처럼 임의의 인덱스를 할당 한 다음 0과 1 사이의 임의의 숫자보다 큰 첫 번째 인덱스를 가져올 수 있습니다.

예를 들어 (DB2의 경우) :

WITH TEMP AS (
SELECT COMLUMN, RAND() AS IDX FROM TABLE)
SELECT COLUMN FROM TABLE WHERE IDX > .5
FETCH FIRST 1 ROW ONLY

— 데이비드
소스

2

이 솔루션을 고려한 후 논리에서 근본적인 결함을 발견했습니다. 이것은 0과 1 사이에 11의 분포가 있으면 첫 번째 행이 해당 기준을 충족시킬 확률이 50 %라고 가정하기 때문에 테이블 시작 부분 근처에서 동일한 작은 설정 값을 일관되게 반환합니다.

— DAVID

0

http://akinas.com/pages/en/blog/mysql_random_row/ 에서 간단하고 효율적인 방법

SET @i = (SELECT FLOOR(RAND() * COUNT(*)) FROM table); PREPARE get_stmt FROM 'SELECT * FROM table LIMIT ?, 1'; EXECUTE get_stmt USING @i;

— Aurélien Ooms
소스

0

dbms_random.value를 사용하는 대신 Oracle에 대한 더 나은 솔루션이 있지만 dbms_random.value로 행을 정렬하려면 전체 스캔이 필요하며 대형 테이블의 경우 상당히 느립니다.

대신 이것을 사용하십시오 :

SELECT *
FROM employee sample(1)
WHERE rownum=1

— sev3ryn
소스

0

파이어 버드의 경우 :

Select FIRST 1 column from table ORDER BY RAND()

— 루이지 04
소스

0

SQL Server 2005 이상에서 num_value연속 값이없는 경우에 대한 @GreyPanther의 답변을 확장 합니다. 데이터 세트를 균등하게 분배 num_value하지 않았거나 숫자가 아닌 고유 식별자 인 경우에도 마찬가지입니다 .

WITH CTE_Table (SelRow, num_value) 
AS 
(
    SELECT ROW_NUMBER() OVER(ORDER BY ID) AS SelRow, num_value FROM table
) 

SELECT * FROM table Where num_value = ( 
    SELECT TOP 1 num_value FROM CTE_Table  WHERE SelRow >= RAND() * (SELECT MAX(SelRow) FROM CTE_Table)
)

— 엔드 리
소스

-1

SQL의 임의 함수가 도움이 될 수 있습니다. 또한 하나의 행으로 제한하려면 끝에 추가하십시오.

SELECT column FROM table
ORDER BY RAND()
LIMIT 1

— nvnvashisth
소스