X와 XY의 상관 관계


11

두 개의 독립적 인 랜덤 변수 X와 Y가있는 경우 X와 곱 XY의 상관 관계는 무엇입니까? 이것이 알려지지 않은 경우, X와 Y가 특정 경우에 발생하는 일이 제로 평균으로 정상이라는 것을 아는 데 관심이 있습니다.


4
이 질문의 동기는 무엇입니까? 우리가 여기서 다른 것을 다루는 것이 최선인지 궁금합니다. 어떤 이유로 XY 변수를 생성 한 연구를 수행하고 있습니까?
gung-Monica Monica 복원

답변:


13

해결책

유효한 솔루션은 가능한 경우 변수 와 의 개별 속성 측면에서 상관 관계를 표현하는 솔루션이 될 것입니다 . 상관 관계를 계산하기 위해서는 와 의 모노 미널 공분산을 계산해야합니다 . 한 번에이 작업을 수행하는 것이 경제적입니다. 간단히 관찰Y X YXYXY

  1. 경우 및 독립적이며, 및 힘이고, 다음 및 무관;Y i j X i Y jXYijXiYj

  2. 독립 변수의 곱에 대한 기대는 기대의 곱입니다.

이것은 와 의 순간에 대한 공식을 제공 합니다.XY

그것이 전부입니다.


세부

순간에 대해 등을 쓰십시오 . 따라서 계산이 의미 있고 유한 한 숫자를 생성하는 모든 숫자 대해,μi(X)=E(Xi)i,j,k,l

Cov(XiYj,XkYl)=E(XiYjXkYl)E(XiYj)E(XkYl)=μi+k(X)μj+l(Y)μi(X)μk(X)μj(Y)μl(Y).

임의 변수의 분산은 자체와의 공분산이므로 분산에 대한 특별한 계산을 수행 할 필요가 없습니다.

이제 소수의 독립적 인 랜덤 변수의 모노 미널, 거듭 제곱, 모멘트와 관련된 모멘트를 계산하는 방법이 분명해졌습니다. 응용 프로그램으로이 결과를 공분산을 분산의 제곱근으로 나눈 상관 관계 정의에 적용합니다.

Cor(X,XY)=Cov(X1Y0,X1Y1)Cov(X1Y0,X1Y0) Cov(X1Y1,X1Y1)=μ2(X)μ1(Y)μ1(X)2μ1(Y)(μ2(X)μ1(X)2)(μ2(X)μ2(Y)μ1(X)2μ2(Y)2).

이것을 원래 변수의 기대, 분산 및 공분산과 관련시키려는 경우 선택할 수있는 다양한 대수 단순화가 있지만 여기에서 수행하면 더 이상 통찰력을 얻을 수 없습니다.


14

총 공분산과의 독립의 법칙 사용하여 와 , 총 분산 법칙을 사용하고 다시 독립성 인 참고XY

Cov(X,XY)=ECov(X,XY|Y)+Cov(EX|Y,EXY|Y)=E(YCov(X,X))+Cov(EX,YEX)=E(YVarX)+Cov(EX,YEX)=EYVarX.
Var(XY)=EVar(XY|Y)+VarE(XY|Y)=E(Y2(VarX|Y))+Var(Y(EX|Y))=E(Y2VarX)+Var(YEX)=E(Y2)VarX+(EX)2VarY=VarXVarY+(EY)2VarX+(EX)2VarY.
Y 상기 내부 조건부 기대, 분산 또는 공분산 중 어느 하나에서 상수로 취급 될 수있다.

위의 공분산과 분산에서 상관 관계는 대수 조작 후 와 같이 두 가지 변동 계수로 잘 표현 될 수 있습니다

corr(X,XY)=11+VarY(EY)2(1+(EX)2VarX).

시뮬레이션으로이 결과를 확인하십시오.

> n <- 1e+6
> x <- rexp(n,2)-2
> y <- rnorm(n,mean=5)
> cv2 <- function(x) var(x)/mean(x)^2
> 1/sqrt(1+cv2(y)*(1+1/cv2(x)))
[1] 0.844882
> cor(x,x*y)
[1] 0.8445373

멋지지만, 나는 몇 가지를 친절하게 지적하고 싶습니다. 1. 두 번째 방정식 세트의 세 번째 줄에 와 같이 괄호가 있어야 ? 2. 질문을 한 사람이 다른 단계 뒤에있는 추론을 따르고 있습니까? 예를 들어 는 가 주어진 것이기 때문 입니다. 몇 가지 단계에 대한 최소한의 설명을 제안합니다. E(Y2VarX)+Var(YEX)ECov(X,XY|Y)=EYCov(X,X)Y
Antoni Parellada

1
네, 빠진 괄호와 설명을 추가했습니다. @whuber의 대답을 선호한다는 것을 인정해야합니다.
Jarle Tufto

5

X 및 Y는 다음 제로 수단과 랜덤 변수 인 특정 경우에서 인해 입니다. 따라서ρ(XY,X)=0E(X2Y)=E[E[X2Y|X]]=E[X2E[Y|X]]=0cov(XY,X)=E(X2Y)E(XY).E(X)=0


-2

X와 XY의 선형 상관 관계는

Corr (X, XY) = Cov (X, XY) / sqrt (var (X) * var (XY))

Cov (X, XY) = 합산 ((X- 평균 (X)) (XY- 평균 (XY)) / n

n-표본 크기; var (X) = X의 분산; var (XY) = XY의 분산


1
문제는 데이터가 아니라 랜덤 변수 에 관한 것입니다.
whuber

2 개의 랜덤 변수가 서로 연관되어 있는지 여부를 어떻게 알 수 있습니까? 데이터를 통해서만 가능합니다. 틀 렸으면 말해줘. 사과.
Sam Gladio

랜덤 변수의 수학적 속성을 사용하여 이론적으로 상관 관계를 계산합니다. 그것은 교량 건설 및 시험과 비교하여 뉴턴 역학의 원리를 사용하여 교량 설계의 강도를 계산하는 것과 매우 동일합니다. 이론과 데이터에 대한 뚜렷한 역할이 있으며 서로 혼동해서는 안됩니다. .
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.