Scipy의 베타 배포 피팅


14

Wikipedia에 따르면 베타 확률 분포에는 두 가지 모양 매개 변수 β가 있습니다.αβ

[ 0 , 1 ] 범위의 숫자가있는 scipy.stats.beta.fit(x)Python을 호출하면 4 개의 값이 반환됩니다. 이것은 나를 이상하게 생각합니다.x[0,1]

인터넷 검색 후 호출하면 세 번째 변수가 0이므로 반환 값 중 하나가 'location'이어야한다는 것을 알았습니다 scipy.stats.beta.fit(x, floc=0).

누구든지 네 번째 변수가 무엇인지, 첫 번째 변수가 β 인지 알고 있습니까?αβ


1
설명서 에서는 마지막 두 "location"및 "scale"매개 변수를 호출합니다. 따라서 네 번째는 스케일 파라미터입니다. 위치와 규모는 표준 통계적 의미를 갖습니다. 이러한 맥락에서 한 가지 해석은 NIST 핸드북에 명시 적으로 제공됩니다 .
whuber

나는 똑같은 문제를 겪고 있지만 어떤 이유로 든 모든 베타 모델은 "물을 보유"하는 경향이 있습니다. 예를 들어 stats.beta.fit([60,61,62,72])내가 얻는다 (0.7313395126217731, 0.7153715263378897, 58.999999999999993, 3.3500998441036982). 내가 이것에 대해 무엇을 할 수 있는지 아십니까?
TheChymera

beta.fit ()을 사용하는 예제를 포함하는 일반적인 연속 랜덤 변수 적합 방법에 대한이 문서를 추가하면됩니다. docs.scipy.org/doc/scipy/reference/generated/…
mathisfun

답변:


13

의 출력에 대한 문서가 분명히 부족 beta.fit하더라도 다음 순서로 출력합니다.

, β , 위치 (하한), 스케일 (상한-하한)αβ


데이터 범위에 따라 하한과 상한을 뱉어 내거나 다른 일을하고 있습니까?
shadowtalker

한계는 확률 분포를 기반으로합니다. 즉. 정규 분포에는 제한이 없지만 표본 데이터가 ~를 초과하는 경우는 거의 없습니다 +/-3. 베타 분포에는 한계가 있으며 한계를 벗어난 확률은 0입니다. 모델링 대상에 따라 데이터가 한계에 도달하지 않을 수 있습니다. 실제로, 많은 베타 분포가 한계에서 확률이 0 인 경향이 있기 때문에 이러한 한계를 데이터 범위와 일치 시키려고하면 문제가 될 수 있습니다. 해당 문제에 대한 자세한 내용은 이 게시물 을 참조하십시오 .
jdj081

1
예, 알고 있습니다 이러한 한계는 항상 0과 1입니다. 따라서이 함수에 의해 반환되는 상한과 하한은 무엇이며 어떻게 "location"과 "scale"과 동일합니까? 나는이 대답을 이해하지 못한다고 생각합니다.
shadowtalker

2
베타 분포가 정의되는 방식에서 이러한 한계는 항상 0과 1입니다. 그러나 일반화 된 베타 분포에는이 두 가지 스케일링 요소가 포함됩니다. 내가 모델링 한 데이터는 0과 1 사이에 있지 않으므로 해당 숫자를 사용해야합니다. 데이터가 0과 1 사이 인 경우 해당 출력은 0과 1에 매우 가까워 야합니다. 한계가 0과 1임을 알고 있으면 floc=0fscale=1kwargs를 사용하여 이들을 강제 할 수 있습니다 . 당신은 여전히 ​​그 출력을 얻을 것이지만, 당신이 그 출력을 강제하는 것과 동일합니다. 알파 및 베타 값이 변경 될 수 있습니다.
jdj081
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.