이 개별 배포판의 이름이 있습니까?


21

이 개별 배포판의 이름이 있습니까? 옵션i1...N

f(i)=1Nj=iN1j

나는이 배포판을 다음에서 보았습니다 : 나는 유틸리티 기능에 의해 순위가 매겨진 항목 목록을 가지고 있습니다. 목록의 시작을 향해 바이어스하면서 항목 중 하나를 임의로 선택하고 싶습니다. 그래서 먼저 1과 사이 의 인덱스 를 균일하게 선택합니다. 그런 다음 인덱스 1과 사이의 항목을 선택합니다 . 이 과정은 위의 분포를 초래한다고 생각합니다.NjNj


2
이것은 분포가 아닙니다 : 정규화되지 않았습니다.
whuber

@ whuber 나는 처음에 그렇게 생각했고 (내가 오해하고 의견을 제거했다는 것을 깨닫기 전에 의견을 말했지만) 나는 그 정의를 오해했다. 더 많은 오해가 없으면 표준화 된 확률 질량 함수입니다.
Glen_b-복귀 모니카

4
정규화되었습니다. 1/1은 합계에 정확히 한 번 나타납니다 (f (1)에 있음). 1/2은 정확히 두 번 나타납니다 (f (1) 및 f (2)에 있음). 모든 합의 합은 N이되고 정규화 상수는 1 / N으로 표시됩니다. 확인합니다.
rcorty

1
더 중요한 것은이 배포판이 무엇인지 모르겠습니다. 또한 당신이 묘사 한 과정이 어떻게이 배포판으로 이어지는 지 모릅니다. 내가 가진 생각 중 하나는 별개의 버전의 스틱 브레이킹 프로세스처럼 들린다는 것입니다.
rcorty

@Glen_b 감사합니다. 나는 렌더링하지 않았다 내 휴대 전화에이 글을 읽고 있었다 충분히 명확하게. f
whuber

답변:


30

음수 로그 분포, 즉 지원이 [0,1] 이고 pdf가 인 분포의 이산화 버전이 f(t)=logt있습니다.

이를 확인하려면 내가 설정 한 값을 적용하려면 확률 변수를 재정의하는거야 대신 { 0 , 1 , 2 , ... , N } 과 전화 분배 결과 T를 . 그럼 내 주장은{0,1/N,2/N,,1}{0,1,2,,N}T

Pr(T=tN)1Nlog(tN)

같은 동안 tN,t 은 (대략) 일정하게 유지됩니다.

먼저,이 수렴을 보여주는 작은 시뮬레이션 실험. 다음은 배포판에서 샘플러를 구현 한 것입니다.

t_sample <- function(N, size) {
  bounds <- sample(1:N, size=size, replace=TRUE)
  samples <- sapply(bounds, function(t) {sample(1:t, size=1)})
  samples / N
}

분포에서 가져온 큰 표본의 히스토그램은 다음과 같습니다.

ss <- t_sample(100, 200000)
hist(ss, freq=FALSE, breaks=50)

여기에 이미지 설명을 입력하십시오

다음은 겹쳐진 로그 PDF입니다.

linsp <- 1:100 / 100
lines(linsp, -log(linsp))

여기에 이미지 설명을 입력하십시오

이 수렴이 발생하는 이유를 보려면 표현부터 시작하십시오.

아르 자형(=)=1j=1j

곱하고 N으로 나눕니다N

Pr(T=tN)=1Nj=tNNj1N

합은 이제 함수 대한 리만 합입니다.g(x)=1xtN1N

Pr(T=tN)1NtN11xdx=1Nlog(tN)

이것이 제가 도착하고 싶은 표현입니다.


천만에요 이것은 큰 질문이었고 나는 그것을 해결하는 데 많은 즐거움을 얻었습니다.
Matthew Drury

6

이것은 Whitworth 분포와 관련이있는 것으로 보입니다. (Whitworth 분포라고 생각하지 않습니다. 올바로 기억하면 순서 값 세트의 분포이기 때문에 연결된 것으로 보이며 동일한 합산 계획에 의존합니다.)

Whitworth (및 수많은 참고 문헌)에 대한 토론이 있습니다.

Anthony Lawrance와 Robert Marks, (2008)
"제한된 자원을 가진 산업에서 기업 규모 분포",
Applied Economics , vol. 40 권 12 호 1595-1607면

( 여기서 작동하는 종이 버전이있는 것 같습니다 )

참조

Nancy L Geller, (1979)
Whitworth 분포에 대한 유의성 검정
, 미국 정보 과학 저널 , Vol.30 (4), pp.229-231


2
이 답변을 독립적으로 만들기 위해 Whitworth 배포판에 대한 정의를 제공하고 연결에 관한 몇 가지 설명을 제공 할 수 있습니까?
whuber

@ whuber 네, 그것은 그대로 의견이어야합니다. 세부 사항을 편집 할 것이지만 결국에는 더 오래 걸릴 것입니다.
Glen_b-복지국 모니카

어떤 종류의 정의가 좋을 것입니다.
whuber

고마워, 그것은 이해되었지만 그럼에도 불구하고 결과가 될 것입니다.
Glen_b-복지국 모니카 1
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.