이것은 자유 도와 통계 매개 변수에 대한 이야기이며 두 사람이 직접 간단한 연결을 갖는 것이 좋은 이유입니다.
역사적으로 " - 1 "용어는 베타 기능의 오일러의 연구에서 나타났다. 그는 1763 년까지 그 매개 변수화를 사용했고 Adrien-Marie Legendre도 사용했습니다. 이 작업은 모든 알려진 통계 응용 프로그램을 방해합니다.−1
"현대 수학 이론은 것으로, 분석, 정수론, 기하학의 응용 프로그램의 재산을 통해 충분한 표시를 제공합니다 - 1 "용어가 실제로 어떤 의미를 가지고있다. 나는 그 이유 중 일부를 질문에 대한 의견으로 스케치했다.−1
"올바른"통계 매개 변수가 무엇인지 더 관심이 있습니다. 그것은 분명하지 않으며 수학 규칙과 같을 필요는 없습니다. 일반적으로 사용되고 잘 알려진 상호 관련된 확률 분포 제품군이 있습니다. 따라서 한 패밀리의 이름을 지정 (즉, 매개 변수화)하는 데 사용되는 규칙은 일반적으로 관련 패밀리의 이름을 지정하는 관련 규칙을 암시합니다. 하나의 매개 변수를 변경하면 모든 매개 변수를 변경하려고합니다. 그러므로 우리는 단서에 대한 이러한 관계를 볼 수 있습니다.
가장 중요한 분배 가족이 일반 가족으로부터 파생된다는 데 동의하지 않는 사람은 거의 없습니다. 리콜 랜덤 변수 것을 X는 것으로 알려져 "통상 분산"때 ( X - μ ) / σ 확률 밀도 갖는다 F ( X ) 에 비례 특급 ( - X 2 / 2 ) . 경우 σ는 = 1 및 μ = 0 , X는 가지고 있다고 표준 정규 분포.X(X−μ)/σf(x)exp(−x2/2)σ=1μ=0X
많은 데이터 세트 x 1 , x 2 , … , x n 은 데이터와 저전력 (일반적으로 제곱)의 합리적인 조합을 포함하는 비교적 간단한 통계를 사용하여 연구됩니다. 해당 데이터가 정규 분포의 랜덤 표본으로 모델링되어 각 x i 가 정규 변수 X i 의 실현으로 간주 될 때 모든 X i 는 공통 분포를 공유하며 독립적입니다. 이러한 통계 분포 정규 분포에 의해 결정됩니다. 실제로 가장 자주 발생하는 것은x1,x2,…,xnxiXiXi
t ν , ν = n - 1 "자유도"를갖는스튜던트 t 분포. 이것은 통계량 t = ˉ X 의 분포입니다tνtν=n−1se ( X ) 여기서 ˉ X =(X1+X2+⋯+Xn)/n은 데이터의 평균을 모델링하고se(X)=(1/√
t=X¯se(X)
X¯=(X1+X2+⋯+Xn)/nn ) √( X 2 1 + X 2 2 + ⋯ + X 2 n ) / ( n - 1 ) − ˉ X 2 는 평균의 표준 오차입니다. 으로 나누기N-1 개방송N이어야2이상, 어디서ν는정수이며1이상이다. 공식은 약간 복잡하지만 공식 2 차 데이터의 합리적인 함수의 제곱근입니다. 비교적 간단합니다.se(X)=(1/n−−√)(X21+X22+⋯+X2n)/(n−1)−X¯2−−−−−−−−−−−−−−−−−−−−−−−−−−−−√n−1n2ν1
χ 2 ν , χ 2 (카이 제곱) 분포와 ν "자유도"(DF). 이 제곱의 합의 분포 ν 독립적 인 표준 정규 변수. 이러한 변수들의 제곱의 평균의 분포 따라서 것이다 χ 2 분포에 의해 스케일링 1 / ν : I는 "정규화"으로이를 참조한다 χ 2 분포.χ2νχ2ννχ21/νχ2
F는 ν 1 , ν 2 , F의 파라미터를 가지는 비 분포 ( ν 1 , ν 2 ) 두 개의 독립적 인 정규화의 비율 χ (2) 와 분배 ν 1 및 ν 2 개 자유도.Fν1,ν2F(ν1,ν2)χ2ν1ν2
수학적 계산은이 세 분포 모두 밀도가 있음을 보여줍니다. 중요하게, χ 2 ν 분포 의 밀도 는 감마 ( Γ ) 함수 에 대한 오일러의 완전한 정의에서 정수와 비례한다 . 그것들을 비교해 봅시다 :χ2νΓ
F χ 2 ν ( 2 X ) α X ν / 2 - 1 개 전자 - X ;f Γ ( ν ) ( x ) ∝ x ν - 1 e - x .
fχ2ν(2x)∝xν/2−1e−x;fΓ(ν)(x)∝xν−1e−x.
이는 χ 2 ν 변수의 두 배에 ν / 2 매개 변수가있는 감마 분포가 있음을 나타냅니다 . 1/2의 요소는 충분히 귀찮지 만 1 을 빼면 관계가 훨씬 악화됩니다. 이것은 이미 질문에 대한 설득력있는 답을 제공합니다 : 우리는의 매개 변수를 원하는 경우 χ 2 분포를 (배까지를 생산 제곱 일반 변수의 수 계산 (1) / 2 , 밀도 함수 필요 후 지수) 그 수의 절반보다 적은 숫자이어야합니다. χ2νν/21χ21/2
왜의 요인 1 / 2 의 차이보다 귀찮은 일이 ? 그 이유는 우리가 추가 할 때 그 요소가 일관성을 유지하기 때문입니다. n 개의 독립 표준 법선 의 제곱합이 매개 변수 n 을 갖는 감마 분포에 비례하고 (일부 인자), m 개의 독립 표준 법선 의 제곱합은 매개 변수 m 을 갖는 감마 분포에 비례합니다 (동일한 계수) 모든 n + m 변수 의 제곱의 합은 모수 m + n (여전히 같은 요인) 을 갖는 감마 분포에 비례합니다 . 1/21nnmmn+mm+n매개 변수를 추가하면 카운트 추가를 모방하는 것이 매우 도움이됩니다.
If, however, we were to remove that pesky-looking "−1−1" from the mathematical formulas, these nice relationships would become more complicated. For example, if we changed the parameterization of Gamma distributions to refer to the actual power of xx in the formula, so that a χ21χ21 distribution would be related to a "Gamma(0)(0)" distribution (since the power of xx in its PDF is 1−1=01−1=0), then the sum of three χ21χ21 distributions would have to be called a "Gamma(2)(2)" distribution. In short, the close additive relationship between degrees of freedom and the parameter in Gamma distributions would be lost by removing the −1−1 from the formula and absorbing it in the parameter.
Similarly, the probability function of an FF ratio distribution is closely related to Beta distributions. Indeed, when YY has an FF ratio distribution, the distribution of Z=ν1Y/(ν1Y+ν2)Z=ν1Y/(ν1Y+ν2) has a Beta(ν1/2,ν2/2)(ν1/2,ν2/2) distribution. Its density function is proportional to
fZ(z)∝zν1/2−1(1−z)ν2/2−1.
fZ(z)∝zν1/2−1(1−z)ν2/2−1.
Furthermore--taking these ideas full circle--the square of a Student tt distribution with νν d.f. has an FF ratio distribution with parameters (1,ν)(1,ν). Once more it is apparent that keeping the conventional parameterization maintains a clear relationship with the underlying counts that contribute to the degrees of freedom.
From a statistical point of view, then, it would be most natural and simplest to use a variation of the conventional mathematical parameterizations of ΓΓ and Beta distributions: we should prefer calling a Γ(α)Γ(α) distribution a "Γ(2α)Γ(2α) distribution" and the Beta(α,β)(α,β) distribution ought to be called a "Beta(2α,2β)(2α,2β) distribution." In fact, we have already done that: this is precisely why we continue to use the names "Chi-squared" and "FF Ratio" distribution instead of "Gamma" and "Beta". Regardless, in no case would we want to remove the "−1−1" terms that appear in the mathematical formulas for their densities. If we did that, we would lose the direct connection between the parameters in the densities and the data counts with which they are associated: we would always be off by one.