라고 가정하자 . 이어서 조건부 분포 주어진 변수 통상, 평균 분산 :
및 분산 :
더 많은 정보를 가지고 있기 때문에 분산이 줄어드는 것이 합리적입니다. 그러나 평균 공식의 직관은 무엇입니까? 과 사이의 공분산 은 조건 평균을 어떻게 고려합니까?
라고 가정하자 . 이어서 조건부 분포 주어진 변수 통상, 평균 분산 :
및 분산 :
더 많은 정보를 가지고 있기 때문에 분산이 줄어드는 것이 합리적입니다. 그러나 평균 공식의 직관은 무엇입니까? 과 사이의 공분산 은 조건 평균을 어떻게 고려합니까?
답변:
문제의 모든 진술은 타원의 속성으로 이해 될 수 있습니다. 에만 필요한 이변 량 정규 분포에 특정 속성은에 있다는 사실이다 표준 의 이변 량 정규 분포 하는 --for X 와 Y는 상관있는 -의 조건부 분산 Y가 에 의존하지 않는 X . (이는 상관 관계가 결여되어 공동 정규 변수에 대한 독립성을 의미한다는 사실의 결과입니다.)
다음 분석은 타원의 속성이 포함 된 것을 정확하게 보여주고 쉽게 기억하기 위해 기본 아이디어와 가능한 가장 간단한 산술을 사용하여 질문의 모든 방정식을 도출합니다.
질문의 분포는 이변 량 정규 분포 패밀리의 구성원입니다. 이들은 모두 표준 이변 량 표준 인 기본 멤버에서 파생되며, 두 개의 상관되지 않은 표준 정규 분포 (두 좌표를 형성 함)를 설명합니다.
왼쪽은 표준 이변 량 정규 밀도의 릴리프 플롯입니다. 오른쪽은 의사 -3D에서 동일하게 표시되며 앞 부분은 얇아져 있습니다.
이것은 원형 대칭 분포 의 예입니다 . 밀도는 중심점으로부터의 거리에 따라 다르지만 그 점으로부터 멀어지는 방향으로는 변하지 않습니다. 따라서 그래프의 윤곽 (오른쪽)은 원입니다.
그러나 대부분의 다른 이변 량 정규 분포는 원형 대칭이 아니지만 단면이 타원입니다. 이 타원은 많은 이변 량 점 구름의 특징적인 모양을 모델링합니다.
공분산 행렬이있는 이변 량 정규 분포의 초상화입니다. 그것은 상관 계수와 데이터 모델이다-2 / 3.
가장 오래된 정의에 따른 타원은 원뿔 섹션으로, 다른 평면에 대한 투영에 의해 왜곡 된 원입니다. 프로젝션의 특성을 고려하여 비주얼 아티스트와 마찬가지로 이해하고 계산하기 쉬운 일련의 왜곡으로 분해 할 수 있습니다.
먼저 타원의 긴 축이 될 길이를 따라 올바른 길이가 될 때까지 원을 늘리십시오 (또는 필요한 경우 짜십시오).
다음으로 단축을 따라이 타원을 꽉 쥐거나 늘립니다.
셋째, 중심을 중심으로 최종 방향으로 회전하십시오.
마지막으로 원하는 위치로 이동하십시오.
이것들은 모두 아핀 변환입니다. (사실, 처음 세 개는 선형 변환입니다 . 최종 이동으로 정의하면됩니다.) 아핀 변환의 구성은 여전히 정의에 따라 다르기 때문에 원에서 최종 타원까지의 순 왜곡은 아핀 변환입니다. 그러나 다소 복잡 할 수 있습니다.
타원의 (천연) 축에 어떤 일이 일어 났는지 주목 하십시오. 이동 및 압착으로 생성 된 축은 물론 축 자체와 함께 회전 및 이동했습니다. 이 축은 타원 자체의 대칭 축이기 때문에 그려지지 않은 경우에도 쉽게 볼 수 있습니다.
우리는 타원에 대한 이해를 이변 량 정규 패밀리와 같이 왜곡 된 원형 대칭 분포를 이해하는 데 적용하려고합니다. 불행히도 이러한 왜곡에는 문제가 있습니다 . 와 x 의 차이를 존중하지 않습니다.있습니다. y 축의. 3 단계에서의 회전은 그것을 망칩니다. 희미한를 봐 배경에 그리드 좌표 : 메쉬의 (그리드에 무슨 일이 쇼를 (1) / 2왜곡 될 때). 첫 번째 이미지에서 원래 세로선 (실선으로 표시) 사이의 간격이 두 배가됩니다. 두 번째 이미지에서 원래 수평선 사이의 간격 (파선으로 표시)이 1/3만큼 줄어 듭니다. 세 번째 이미지에서는 격자 간격이 변경되지 않지만 모든 선이 회전합니다. 네 번째 이미지에서 위와 오른쪽으로 이동합니다. 최종 결과는 최종 결과를 보여주고이 늘어난, 압착, 회전, 이동 된 그리드를 표시합니다. 상수 좌표 의 원래 실선 은 더 이상 수직이 아닙니다.
핵심 아이디어 --one는이 말을 감히 할 수회귀 요점 는 수직선을 회전시키지 않고 원을 타원으로 왜곡 할 수있는 방법이 있다는 것입니다 . 회전이 범인 이었으므로 추적을 자르고 실제로 회전하는 것처럼 보이지 않고 회전 된 타원 을 만드는 방법을 보여 드리겠습니다 !
이것은 스큐 변환입니다. 실제로 한 번에 두 가지 작업을 수행합니다.
그것은 방향으로 ( 즉, λ 의 양으로) 압착된다 . 이것은 x 축만 남겨둔다 .
이 시점은 어디에서 시작 되었습니까?
좌에서 우로.
). (색상은 그림에서 다른 밀도의 양을 나타냅니다.)
회귀를 할 준비가되었습니다. 회귀를 수행하는 표준적이고 우아한 (아직 간단한) 방법은 먼저 원래 측정 값을 새로운 측정 단위로 표현하는 것입니다. 우리는 변수를 그 중심에두고 표준 편차를 단위로 사용합니다. 이렇게하면 분포 중심이 원점으로 이동하고 모든 타원형 윤곽이 45도 (위 또는 아래)로 기울어집니다.
선 것으로 판명되는 회귀 곡선.
합니다. 최소 제곱 라인은 회귀 라인과 일치합니다.
이 아름다운 결과는 수직 스큐 변환 이 변경하지 않는다는 좌표를 합니다.
사실의 결과입니다.
우리는 더 쉽게 말할 수 있습니다.
따라서
결과적으로 회귀선의 방정식은
어디
훨씬 더 잘 알려진 제곱근은 처음에 설명 된 것입니다 (뒤틀림 변형 대신 회전 포함). 단일 값 분해에 의해 생성 된 것이며 주요 구성 요소 분석 (PCA)에서 중요한 역할을합니다.
도 회전.
따라서 PCA와 회귀의 차이는 상관 행렬의 두 특수 제곱근의 차이로 귀속됩니다.
다변량 분포를 '분할'하는 곳. 아래 그림을 고려하십시오.
.
dnorm(y)
. 간단히 25
&에 출력을 추가하고 45
로 사용하십시오 x
.