어떻게 의존성과 제로 공분산이있을 수 있는지 설명 할 수 있습니까?


12

Greg가하는 것처럼 누군가를 설명 할 수 있지만 좀 더 자세하게는 임의의 변수가 어떻게 종속 될 수 있지만 공분산이 없는가? 그렉, 여기에 포스터, 원을 사용하는 예제 제공 여기를 .

누군가 여러 단계의 프로세스를 설명하는 일련의 단계를 사용하여이 프로세스를 더 자세히 설명 할 수 있습니까?

또한 심리학의 예를 알고 있다면 관련 개념 으로이 개념을 설명하십시오. 귀하의 설명에 매우 정확하고 순차적이며, 그 결과에 대해 설명하십시오.


참조하는 기사에 대한 링크가 도움이 될 것입니다.
gui11aume

1
주제가 여기에 있다고 확신합니다 : stats.stackexchange.com/questions/12842/… 그리고 Greg (Snow)의 대답은 여기에 있습니다 : stats.stackexchange.com/a/12898/2073
Andy McKenzie

처음 에이 질문을 닫는 것이 정확하다고 생각했지만 아마도 stats.stackexchange.com/questions/12842/…와는 조금 다른 질문을 할 것 입니다. 그 스레드는 수학 예제를 요구했기 때문에이 질문은 정확하게 이해하는 것으로 보입니다. 두 가지가 서로 다른 이유
Macro

답변:


21

여기에서의 기본 아이디어는 공분산 은 하나의 특정 유형의 의존성 만 측정 하므로 그 둘은 동일하지 않다는 것입니다. 구체적으로 특별히,

  • 공분산 은 두 변수가 선형 적으로 관련되어 있는 척도 입니다. 두 변수가 비선형 적으로 관련되어 있으면 공분산에 반영되지 않습니다. 자세한 설명은 여기를 참조하십시오 .

  • 랜덤 변수 사이의 의존성 은 두 변수 사이의 관계가 "자체"와 다르게 "함께"행동하게하는 관계를 말합니다. 구체적으로, 랜덤 변수 간의 의존성은 두 분포 사이의 모든 관계를 가정하여 결합 분포가 한계 분포의 곱이 되지 않도록 합니다. 여기에는 선형 관계뿐만 아니라 많은 다른 관계도 포함됩니다.

  • 두 개의 변수가 비선형 적으로 관련 되어 있으면 잠재적으로 공분산이 0 일 수 있지만 여전히 종속적입니다. 여기에 많은 예가 나와 있으며 아래의 그림은 wikipedia에서 아래 행의 그래픽 예를 보여줍니다.

    여기에 이미지 설명을 입력하십시오

  • 랜덤 변수 사이의 제로 공분산과 독립성이 동등한 조건 인 한 가지 예는 변수가 공동 정규 분포 인 경우입니다 (즉, 두 변수는 이변 량 정규 분포를 따르며 , 이는 개별적으로 정규 분포되는 두 변수와 같지 않습니다). 또 다른 특별한 경우는 베르누이 변수 쌍이 독립적 일 경우에만 상관 관계가 없다는 것입니다 (@cardinal 덕분에). 그러나 일반적으로이 둘을 동등하게 간주 할 수는 없습니다.

따라서 일반적으로 두 변수가 서로 관련이없는 것처럼 보이기 때문에 독립적이라는 결론을 내릴 수 없습니다 (예 : 상관 관계가 없다는 귀무 가설을 기각하지 않음). 상관 관계 테스트에서 멈추지 않고 두 가지가 관련되어 있는지 여부를 추론하기 위해 데이터를 플로팅하는 것이 좋습니다. 예를 들어 (@gung 덕분에) 선형 회귀 분석을 수행하고 (0이 아닌 상관 관계 테스트) 유사하지 않은 결과를 찾은 경우 변수가 관련이 없다고 결론을 내릴 수 있습니다. ve는 선형 관계 만 조사했습니다 .

나는 심리학에 대해 많이 알지 못하지만 변수 사이에 비선형 관계가있을 수 있다는 것이 합리적입니다. 장난감의 예로써,인지 능력은 나이와 비선형 적으로 관련이있을 수 있습니다. 아주 젊고 아주 나이 든 사람들은 30 세만큼 예리하지 않습니다. 인지력 대 연령의 일부 척도를 계획한다면,인지 능력이 중간 나이에 가장 높고 그 주변에서 부패하는 것을 볼 수 있습니다. 이는 비선형 패턴 일 것입니다.


1
단지 측면 ( pedantic ?! ) 메모이지만 Bernoulli 랜덤 변수는 상관이없는 경우에만 독립적입니다. :)
추기경

@ cardinal, 단 하나의 공분산 행렬을 가진 다변량 법선이 "일반적으로 사용되며 통계적으로 관련되어있다"고 말했을 때와 같이 합리성을 다시 포기한다는 것만 걱정하지 마십시오.
매크로

다음에 앤 아버에있을 때, 그 농담을 상쇄하기 위해 커피를 사 줄 것입니다. 그동안 내 합리성에 의문을 제기하십시오. :)
추기경

아, 그러나 마지막 인용은 사실 이다. ;-) 놀랍게도 일반적인 장소에 나타납니다. :) (여기서 약간의 주제
추기경

(+1) 나는이 질문이 중복으로 종결되어야하는지 아닌지에 대해 약간의 울타리에 서있다. 그러나 좋은 답변은 유지해야 할 매우 유사한 질문을 만들 수 있다고 생각합니다. 모든 것이 상호 연결되어 있으면 도움이됩니다.
추기경

7

상관 관계 또는 공분산을 가르치고 시각화하는 표준 방법은 데이터를 플로팅하고 'x'와 'y'의 평균으로 선을 그린 다음 2 개의 평균점에서 개별 데이터 포인트까지 사각형을 그리는 것입니다.

여기에 이미지 설명을 입력하십시오

오른쪽 위와 왼쪽 아래 사분면 (예에서 빨간색)의 사각형 (점)은 상관 관계 / 공분산에 양수 값을 제공하고 왼쪽 위와 오른쪽 아래 사분면 (예에서 파란색)의 사각형 (점)은 음수를 나타냅니다. 상관 / 공분산에 대한 값. 빨간색 사각형의 총 면적이 파란색 사각형의 총 면적과 같으면 양수와 음수가 취소되고 공분산이 없습니다. 빨간색에 더 많은 면적이 있으면 공분산은 양수이고 파란색에 더 많은 면적이 있으면 공분산은 음수입니다.

이제 이전 토론의 예를 살펴 보겠습니다.

여기에 이미지 설명을 입력하십시오

개별 점은 포물선을 따르므로 종속적입니다. 'x'를 알고 있다면 'y'를 정확하게 알고 있지만 모든 빨간색 사각형에 대해 일치하는 파란색 사각형이 있으므로 최종 공분산은 0입니다. .


(+1) R이 플롯을 만드는 패키지가 있습니까 (Whuber가 이와 같은 플롯을 한 번 표시하는 것을 기억합니다) 또는 처음부터 이것을 했습니까?
Macro

@Macro, 좋은 질문이지만 whuber는 Mathematica에서 수행되었다고 생각합니다. R을 사용 polygon하거나 rect알파 투명도를 지원하는 장치 에서 "손으로"이 작업을 수행하는 것이 간단합니다 .
추기경

이 플롯을 수행하는 함수를 작성했으며 TeachingDemos곧 패키지에 추가 할 것입니다 . 내 첫 번째 생각은 "상관 사각형"이라는 구를 함수의 이름으로 "수정"으로 단축하는 것이었고, 그 후에 약간 다른 무언가를하는 것으로 그 이름이 쉽게 오해 될 수 있다는 것을 깨달았습니다. 더 나은 이름을 찾고 몇 가지 옵션을 추가 한 다음 R-Forge에 업로드해야합니다.
Greg Snow

3

데이터가 기본적으로 평균을 통해 수직 또는 수평 축을 중심으로 대칭적인 패턴을 따르는 경우 공분산은 거의 0에 가깝다는 간단한 테스트입니다. 예를 들어 대칭이 y 축 주위에있는 경우, 주어진 y를 갖는 각 값에 대해 평균 x와 양의 x 차이가 있고 평균 x와 음의 차이가 있음을 의미합니다. 해당 값에 y * x를 더하면 0이됩니다. 다른 답변의 예제 플롯 모음 에서이 그림을 잘 볼 수 있습니다. 공분산이 0이지만 독립성이 아닌 다른 패턴이 있지만, 많은 예는 대칭을 찾아서 쉽게 평가할 수 있습니다.


1

Wikipedia 의 예 :

"변수가 독립적 인 경우 Pearson의 상관 계수는 0이지만 상관 계수가 두 변수 사이의 선형 종속성 만 감지하기 때문에 반대의 경우가 아닙니다. 예를 들어, 랜덤 변수 X가 0에 대해 대칭 적으로 분포되고 Y = X ^ 2. 그런 다음 Y는 X에 의해 완전히 결정되므로 X와 Y는 완전히 의존적이지만 상관 관계는 0이며 상관 관계가 없습니다. 그러나 X와 Y가 공동으로 정상인 특수한 경우 상관 관계는 독립성과 같습니다. "

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.