답변:
이 결과에 대해 흥미로운 점은 상관 계수의 분포가 얼마나 보이는지입니다. 이유가 있습니다.
가 두 변수에 대해 0의 상관 관계와 공통 분산 를 갖는 이변 량 정상 이라고 가정 합니다. iid 샘플 립니다. 표본 상관 계수의 분포 가 잘 알려져 있으며, 피셔 (Fisher)가 1 세기 전과 같이 기하학적으로 쉽게 확립
이다
(여기서 평소와 같이 및 ˉ y 는 표본 평균이고 S x 및 S y 는 바이어스되지 않은 분산 추정량의 제곱근입니다.) B 는 Beta 함수 입니다.
을 계산하기 위해 ( 1 , 1 , … , 1 )에 의해 생성 된 선 주위 에서 R n로 회전 할 때의 불변성과 동일한 회전에서 샘플 분포의 불변을 이용 하고 y i / S를 선택할 수 있습니다 y 는 성분의 합이 0 인 단위 벡터입니다. 하나의 이러한 벡터에 비례 V = ( N - 1 , - 1 , ... , - 1 ) . 표준 편차는
따라서 은 다음과 같은 분포를 가져야합니다.
따라서 Z 의 분포를 찾기 위해 을 재조정 하면됩니다 .
for . Formula (1) shows this is identical to that of the question.
Not entirely convinced? Here is the result of simulating this situation 100,000 times (with , where the distribution is uniform).
제 히스토그램 플롯의 상관 계수 번째 히스토그램 플롯 동안의 상관 계수 ( X I , V I ) , 난 = 1 , ... , 4 ) A에 대한 모든 반복에 대해 고정 된 무작위로 선택된 벡터 v i . 둘 다 균일합니다. 오른쪽의 QQ- 플롯은 이러한 분포가 본질적으로 동일하다는 것을 확인합니다.
R
플롯을 생성 한 코드는 다음과 같습니다 .
n <- 4
n.sim <- 1e5
set.seed(17)
par(mfrow=c(1,3))
#
# Simulate spherical bivariate normal samples of size n each.
#
x <- matrix(rnorm(n.sim*n), n)
y <- matrix(rnorm(n.sim*n), n)
#
# Look at the distribution of the correlation of `x` and `y`.
#
sim <- sapply(1:n.sim, function(i) cor(x[,i], y[,i]))
hist(sim)
#
# Specify *any* fixed vector in place of `y`.
#
v <- c(n-1, rep(-1, n-1)) # The case in question
v <- rnorm(n) # Can use anything you want
#
# Look at the distribution of the correlation of `x` with `v`.
#
sim2 <- sapply(1:n.sim, function(i) cor(x[,i], v))
hist(sim2)
#
# Compare the two distributions.
#
qqplot(sim, sim2, main="QQ Plot")
RA Fisher, 무한한 모집단의 표본에서 상관 계수 값의 빈도 분포 . Biometrika , 10 , 507 항을 참조 3. (인용 통계 켄달의 고급 이론 , 5 에드., 섹션 16.24.)
I'd like to suggest this way to get the pdf of Z by directly calculating the MVUE of using Bayes' theorem although it's handful and complex.
Since and , are joint complete sufficient statistic, MVUE of would be like this:
Now using Bayes' theorem, we get
The denominator can be written in closed form because , are independent of each other.
To get the closed form of numerator, we can adopt these statistics:
which is the mean and the sample variance of and they are independent of each other and also independent of . We can express these in terms of .
,
We can use transformation while ,
Since , we can get the closed form of this. Note that this holds only for which restricts to .
So put them all together, exponential terms would disappear and you'd get,
From this,at this point, we can get the pdf of using transformation.
By the way, the MVUE would be like this :
I am not a native English speaker and there could be some awkward sentences. I am studying statistics by myself with text book introduction to mathmatical statistics by Hogg. So there could be some grammatical or mathmatical conceptual mistakes. It would be appreciated if someone correct them.
Thank you for reading.