왜 위와 아래에 숫자가 도움이 되나요?
에 정의 된 분배 데이터에 대한 모델로서 적합하다 무엇 ( 0 , 1 ) . 나는 텍스트가 " ( 0 , 1 ) 에 대한 데이터 모델 "(또는 일반적으로 ( a , b ) 보다 더 중요한 의미는 없다고 생각한다 )( 0 , 1 )( 0 , 1 )( 0 , 1 )( a , b ) ) .
이 분포는 무엇입니까?
불행하게도 'log-odds distribution'이라는 용어는 완벽하게 표준이 아니며 (그 당시에도 매우 일반적인 용어는 아님)
그 의미에 대한 몇 가지 가능성에 대해 이야기하겠습니다. 단위 간격의 값에 대한 분포를 구성하는 방법을 고려하여 시작하겠습니다.
연속 랜덤 변수 in ( 0 , 1 ) 을 모델링하는 일반적인 방법 은 베타 분포 이고 [ 0 , 1 ]의 이산 비율을 모델링하는 일반적인 방법 은 스케일 이항 ( P = X / n )입니다. 엑스피( 0 , 1 )[ 0 , 1 ]피= X/ n엑스 는 개수입니다).
베타 분포를 사용하는 것에 대한 대안은 연속적인 역 CDF ( ) 를 가져 와서 ( 0 , 1 ) 의 값을 실수 선 으로 변환 하거나 거의 사용하지 않는 것입니다. 변환 된 범위의 값을 모델링하기위한 모든 관련 분포 ( G ) 실제 선 ( F , G) 에서 연속 분포가 쌍을 이루기 때문에 많은 가능성이 열립니다.에프− 1( 0 , 1 )지에프, G변환과 모형에 ) 사용할 수 .
예를 들어, 로그-홀수 변환 (logit이라고도 함)는 이러한 역 -cdf 변환 (표준물류의 역 CDF 임) 중 하나이며Y에대한 모형으로 고려할 수있는 많은 분포가 있습니다.와이= 로그( P1 - P)와이
그런 다음 실제 라인에서 간단한 2 매개 변수 패밀리 인 Y 에 대한 로지스틱 모델 을 사용할 수 있습니다 . 역 로그 홀수 변환을 통해 ( 0 , 1 )로 다시 변환 (예 : P = exp ( Y )( μ , τ)와이( 0 , 1 ) 는P에대해 두 가지 모수 분포를 산출하는데, 하나는 단봉 형 또는 U 형 또는 J 형, 대칭 또는 스큐 일 수 있습니다. 로지스틱이 로지스틱이므로 -logistic). 다음은 서로 다른μ,τ값에 대한 몇 가지 예입니다.피= 특급( Y)1 + 특급( Y)피μ , τ
위튼 외 알에 의해 텍스트의 간략한 언급을 보면,이 힘 있지만, 다른 쉽게 평균 뭔가를 수도 - "로그 확률 분포를"의도 무슨합니다.
또 다른 가능성은 로짓 정규 을 의도 한 것입니다.
그러나이 용어는 예를 들어 van Erp & van Gelder (2008) [ 1 ] 에서 베타 분포에 대한 로그-홀수 변환 (log-odds transformation)을 지칭하는 것으로 사용 된 것으로 보인다 (따라서 F 를 물류로, G 를 a의 로그의 분포 베타 프라임 랜덤 변수 또는 등가 두 카이 제곱 확률 변수의 로그)의 차분의 분포. 그러나 그들은 이것을 사용하여 모델 카운트 비율 을 수행합니다 . 이것은 물론 몇 가지 문제를 야기합니다 (0과 1에서 유한 확률로 분포를 모형화하여 ( 0 , 1 ))[ 1 ]에프지( 0 , 1 ))에 많은 노력을 기울이는 것 같습니다. (부적절한 모델을 피하는 것이 더 쉬울 것 같지만 어쩌면 저뿐 일 것입니다.)
몇몇 다른 문서들 (적어도 3 개 이상 발견)은 로그 홀수의 표본 분포 ( 위 의 척도 )를 "로그 홀수 분포"(일부 경우 P 가 이산 비율 *이고 일부는 연속 비율 인 경우)-따라서이 경우 확률 모델은 아니지만 실제 분포에 일부 분포 모델을 적용 할 수 있습니다.와이피
* 또,이 경우, 그 문제를 가지고 정확히 0 또는 1의 값 Y는 것 - ∞ 또는 ∞피와이− ∞∞ 우리는이 목적을 위해 그것을 사용하는 0과 1에서 멀리 분포를 결합한다 제안하는 ... 각각.
Yan Guo (2009) [ 2 ] 의 논문 은이 용어를 로그- 분포 분포, 실제 반선의 오른쪽으로 치우친 분포를 나타냅니다.[ 2 ]
보시다시피, 이것은 단일 의미를 가진 용어가 아닙니다. Witten 또는 해당 저서의 다른 저자 중 한 사람의 명확한 표시가 없으면 의도 한 내용을 추측해야합니다.
[1] : Noel van Erp & Pieter van Gelder, (2008),
"고장 발생시 베타 분포를 해석하는 방법" , 다름슈타트
제 6 회 국제 확률론 워크샵 진행
pdf 링크
[2] : Yan Guo (2009),
NDE 시스템 포드 기능 평가 및 견고성에 관한 새로운 방법
, 미시건 주 디트로이트 웨인 주립 대학 대학원 논문 제출