이 개별 배포판의 이름이 있습니까? 옵션
나는이 배포판을 다음에서 보았습니다 : 나는 유틸리티 기능에 의해 순위가 매겨진 항목 목록을 가지고 있습니다. 목록의 시작을 향해 바이어스하면서 항목 중 하나를 임의로 선택하고 싶습니다. 그래서 먼저 1과 사이 의 인덱스 를 균일하게 선택합니다. 그런 다음 인덱스 1과 사이의 항목을 선택합니다 . 이 과정은 위의 분포를 초래한다고 생각합니다.
이 개별 배포판의 이름이 있습니까? 옵션
나는이 배포판을 다음에서 보았습니다 : 나는 유틸리티 기능에 의해 순위가 매겨진 항목 목록을 가지고 있습니다. 목록의 시작을 향해 바이어스하면서 항목 중 하나를 임의로 선택하고 싶습니다. 그래서 먼저 1과 사이 의 인덱스 를 균일하게 선택합니다. 그런 다음 인덱스 1과 사이의 항목을 선택합니다 . 이 과정은 위의 분포를 초래한다고 생각합니다.
답변:
음수 로그 분포, 즉 지원이 이고 pdf가 인 분포의 이산화 버전이 있습니다.
이를 확인하려면 내가 설정 한 값을 적용하려면 확률 변수를 재정의하는거야 대신 { 0 , 1 , 2 , ... , N } 과 전화 분배 결과 T를 . 그럼 내 주장은
같은 동안 t 은 (대략) 일정하게 유지됩니다.
먼저,이 수렴을 보여주는 작은 시뮬레이션 실험. 다음은 배포판에서 샘플러를 구현 한 것입니다.
t_sample <- function(N, size) {
bounds <- sample(1:N, size=size, replace=TRUE)
samples <- sapply(bounds, function(t) {sample(1:t, size=1)})
samples / N
}
분포에서 가져온 큰 표본의 히스토그램은 다음과 같습니다.
ss <- t_sample(100, 200000)
hist(ss, freq=FALSE, breaks=50)
다음은 겹쳐진 로그 PDF입니다.
linsp <- 1:100 / 100
lines(linsp, -log(linsp))
이 수렴이 발생하는 이유를 보려면 표현부터 시작하십시오.
곱하고 N으로 나눕니다
합은 이제 함수 대한 리만 합입니다.
이것이 제가 도착하고 싶은 표현입니다.
이것은 Whitworth 분포와 관련이있는 것으로 보입니다. (Whitworth 분포라고 생각하지 않습니다. 올바로 기억하면 순서 값 세트의 분포이기 때문에 연결된 것으로 보이며 동일한 합산 계획에 의존합니다.)
Whitworth (및 수많은 참고 문헌)에 대한 토론이 있습니다.
Anthony Lawrance와 Robert Marks, (2008)
"제한된 자원을 가진 산업에서 기업 규모 분포",
Applied Economics , vol. 40 권 12 호 1595-1607면
참조
Nancy L Geller, (1979)
Whitworth 분포에 대한 유의성 검정
, 미국 정보 과학 저널 , Vol.30 (4), pp.229-231