상관 랜덤 변수 생성 공식은 어떻게 작동합니까?


19

2 개의 상관 관계가없는 임의의 변수 가 있으면 수식을 사용하여 2 개의 상관 관계가있는 임의 변수를 만들 수 있습니다엑스1,엑스2

와이=ρ엑스1+1ρ2엑스2

다음 상관 것 와 .ρ X 1와이ρ엑스1

누군가이 수식의 출처를 설명 할 수 있습니까?


1
이 문제와 관련 문제에 대한 광범위한 토론은 stats.stackexchange.com/a/71303의 답변에 나와 있습니다. 무엇보다도, 그것은 (1) 정규성의 가정이 무관 (2) 추가 가정을 할 필요가 일반한다 다음은의 편차를 및 의 상관 관계의 순서와 동일해야 와 될 . X 2 Y X 1 ρ엑스1엑스2와이엑스1ρ
whuber

매우 흥미로운 링크. 나는 정상 성이 무의미하다는 것이 무슨 의미인지 잘 모르겠습니다. 경우 또는 정상되지 않고, 밀도 제어하기 어려워진다 카이저 - Dickman 알고리즘을 통하여. 이는 특수 알고리즘이 비정상 상관 데이터를 생성하는 전체 이유입니다 (예 : Headrick, 2002; Ruscio & Kaczetow, 2008; Vale & Maurelli, 1983) 예를 들어 목표가 ~ normal, ~ uniform 을 생성한다고 가정하십시오. = .5 와 함께 . ~ uniform을 사용하면 가 균일하지 않습니다 ( 는 보통 일반과 균일의 선형 조합 임). X 2 Y X Y ρ X 2 Y Y엑스1엑스2와이엑스와이ρ엑스2와이와이
Anthony

@Anthony이 질문은 상관 관계에 대해서만 묻습니다 . 이것은 순전히 첫 번째와 두 번째 순간의 함수입니다. 대답은 분포의 다른 속성에 의존하지 않습니다. 당신이 논의하고있는 것은 완전히 다른 주제입니다.
whuber

답변:


17

당신이 선형의 조합을 찾으려는 가정 및 그러한를X 2엑스1엑스2

코르(α엑스1+β엑스2,엑스1)=ρ

와 에 동일한 (0이 아닌) 상수 를 곱 하면 상관 관계가 변경되지 않습니다. 따라서 분산을 유지하기위한 조건을 추가하겠습니다.β var ( α X 1 + β X 2 ) = var ( X 1 )αβvar(α엑스1+β엑스2)=var(엑스1)

이것은

ρ=코브(α엑스1+β엑스2,엑스1)var(α엑스1+β엑스2)var(엑스1)=α코브(엑스1,엑스1)=var(엑스1)+β코브(엑스2,엑스1)=0var(α엑스1+β엑스2)var(엑스1)=αvar(엑스1)α2var(엑스1)+β2var(엑스2)

두 랜덤 변수가 동일한 분산을 가지고 있다고 가정하면 (이것은 중요한 가정입니다!) ( )var(엑스1)=var(엑스2)

ρα2+β2=α

이 방정식에는 여러 가지 솔루션이 있으므로 분산 보존 조건을 다시 호출해야합니다.

var(엑스1)=var(α엑스1+β엑스2)=α2var(엑스1)+β2var(엑스2)α2+β2=1

그리고 이것은 우리를

α=ρβ=±1ρ2

UPD . 두 번째 질문과 관련하여 그렇습니다 . 미백 으로 알려져 있습니다 .


9

방정식은 Cholesky 분해 의 단순화 된 이변 량 형태입니다 . 이 단순화 된 방정식을 때때로 Kaiser-Dickman 알고리즘이라고합니다 (Kaiser & Dickman, 1962).

참고 및 제대로 작동하려면이 알고리즘에 대해 동일한 분산을해야합니다. 또한 알고리즘은 일반적으로 일반 변수와 함께 사용됩니다. 경우 또는 정상 아닌, 같은 분포 형태가 없을 수도 .X 2 X 1 X 2 Y X 2엑스1엑스2엑스1엑스2와이엑스2

참고 문헌 :

Kaiser, HF, & Dickman, K. (1962). 임의 모집단 상관 행렬의 표본 및 모집단 점수 행렬 및 표본 상관 행렬 Psychometrika, 27 (2), 179-182.


2
표준화 된 정규 변수가 필요하지 않고 동일한 분산을 갖는 것으로 충분하다고 가정합니다.
Artem Sobolev

2
아니,의 분포 것입니다 하지 혼합 당신이 주장하는 것처럼 유통. 와이
Dilip Sarwate

@Dilip Sarwate. 어느 경우 또는 X 2가 비정규 인 후 Y는 원하는 분배 될 수없는 두 변수의 선형 조합이된다. 이는 비정상 상관 데이터 생성을위한 특수 알고리즘 (Kaiser-Dickman 대신)의 이유입니다. 엑스1엑스2와이
Anthony

3

상관 계수는 두 시리즈가 벡터로 취급되는 경우 ( n t h 데이터 포인트가 벡터의 n t h 차원 임) 두 계열 간의 입니다. 위의 공식은 단순히 벡터를 cos θ , s i n θ 성분 ( X 1 , X 2에 대하여)으로 분해 합니다. 만약 ρ = C O S θ 다음 cosnthnthcosθsinθX1,X2
ρ=cosθ.1ρ2=±sinθ

왜냐하면 만약 비 상관, 그들 사이의 각도 (비정규이라도 즉, 이들이 직각으로 간주 될 수있는 베이시스 벡터)에 직각이다.X1,X2


2
우리 사이트에 오신 것을 환영합니다! T를 사용하여 수학 표현식을 마크 업하면 게시물에 더 많은 관심을 기울일 것이라고 생각합니다 : 달러 기호로 묶습니다. 편집 할 때 사용 가능한 도움말이 있습니다. 이자형엑스
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.