한 변수의 표준 편차가 0 인 경우 상관 관계는 무엇입니까?


15

알다시피, 방정식을 사용하여 공분산을 정규화하여 상관 관계를 얻을 수 있습니다

ρi,j=cov(Xi,Xj)σiσj

여기서 σi=E[(Xiμi)2]의 표준 편차입니다Xi.

표준 편차가 0이면 내 관심사는 무엇입니까? 0이 될 수 없다는 조건이 있습니까?

감사.


11
표준 편차가 0 인 변수는 다른 (일정하지 않은) 변수와 상관 될 수 있습니다. 상관 관계는 한 변수의 큰 / 작은 값이 다른 변수의 큰 / 작은 값에 해당하는 정도를 측정 한 것입니다. 변수 중 하나가 확률 1의 상수 (표준 편차가 0 인 결과)와 같으면 ' 다른 변수가 작은 지 또는 큰지에 대한 정보를 제공 할 수 있습니다. 나는 컨벤션이 무엇인지 모르지만 그 경우 상관 관계를 0으로 정의 해야하는 것처럼 보입니다.
Macro

많은 매크로 감사합니다. 귀하의 아이디어가 아래 답변과 동일하다고 생각합니다. 그러나 포인트 제한으로 인해 귀하의 의견에 투표하지 못했습니다. 감사.
chepukha

4
이미 답변을 수락 했으므로 의견을 작성하겠습니다. 랜덤 변수 표준 편차가 σ Y = 0 이면 다른 임의의 변수 X에 대해 cov ( X , Y ) = E [ ( X μ X ) ( Y μ Y ) ] = 0 입니다 ( Y - μ 이후 Y ) = 0 , 확률 1YσY=0
cov(X,Y)=E[(XμX)(YμY)]=0
X(YμY)=01 ). 따라서, 상관 계수의 정의 는 불확정 형태0을제공합니다ρX,Y=cov(X,Y)σXσY . 이는 통상적 인 것이다정의ρX를,Y는동일하게0이 경우에, 이것은의 한계 값의 근거 방어 할 수ρX,YσY000 ρX,Y0ρX,YσY0
딜립 사와 트는

6
@Dilip, 대답이라면 대답으로 가야합니다. 답변이 이미 수락되었는지는 중요하지 않습니다.
Andy W

1
@Dilip 0 의 문제 형식은 제한 연산을 통해 명확한 값을 가질 수 있더라도 값은 제한을 수행하는 방법에따라 다릅니다. ρX,Y=0이라는 주장은 불완전하다 (그리고 설득력이 없다). 이 규약을 채택하고 정당한 이유로이를지지하는 출처를 인용 할 수 있습니까? 00ρX,Y=0
whuber

답변:


14

SD 중 하나가 0이면 해당 방정식이 정의되지 않은 것이 사실입니다. 그러나 이것을 생각하는 더 좋은 방법은 SD 중 하나가 0이면 상관 관계가 없다는 것입니다. 느슨한 개념의 용어로, 상관 관계는 다른 변수가 움직일 때 한 변수가 어떻게 움직이는 지 알려줍니다. SD가 0이면 변수가 '움직이고 있지 않음'을 의미합니다. 다음과 같은 상수로 구성된 벡터가 있어야합니다.rep(constant, n_times) .


고마워 나는 그것이 의미가 있다고 생각합니다. 교과서에서 그 사례를 언급하지 않은 것이 흥미 롭습니다.
chepukha

@gung 이것은 상관 계수의 정의에있어서의 한계입니다. 상관 관계 방정식은 두 개의 값을 가질 수 있습니다. 하나는 변수 중 하나의 SD가 0 일 때 위의 방정식에서 주어진 것과 0입니다.
prashanth

@ prashanth, 나는 가정합니다.
gung-복직 모니카

2

고려해야 할 다른 것은 평균과 표준 편차 및 상관 관계에 대해 이야기 할 때의 기본 가정입니다.

우리가 데이터 샘플에 관해 이야기하고 있다면, 데이터가 (적어도 대략적으로) 정규 분포되어 있거나 (예를 들어 로그 변환을 통해) 변환 될 수 있다는 일반적인 가정이 있습니다. 표준 편차가 0 인 경우 두 가지 시나리오가 있습니다. 표준 편차가 실제로는 0이 아니지만 매우 작기 때문에 모든 데이터 세트에 평균값을 갖는 샘플이 있습니다 (예 : 거친 정밀도로 데이터를 측정하는 경우); 또는 모델이 잘못 지정되었습니다.

이 두 번째 시나리오에서 표준 편차와 결과적으로 상관 관계는 의미가 없습니다.

더 일반적으로, 기본 분포는 유한 초 순간 모멘트를 가져야하며 따라서 상관이 유효한 개념이되기 위해서는 0이 아닌 표준 편차가 있어야합니다.


원래의 질문은 데이터가 아니라 (이론적) 분포에 관한 것입니다.
whuber

이 경우 표준 편차가 0이면 평균에서만 측정 값이있는 퇴화 분포 (즉, 상수 함수)를 의미합니다. 다시 표준 편차는 기본 분포가 정상임을 의미합니다. 표준 편차가 0이면 가우스 PDF가 제대로 정의되지 않아 모델에서 허용되지 않습니다.
tdc

당신의 의견에 가우시안이 등장한 것에 놀랐습니다, 톰 이것은 불필요한 제한처럼 보입니다. pdf의 존재를 요구하는 것 또한 제한적인 것처럼 보입니다 (결국에는 pdf가있는 개별 배포가 없습니다). 또한 SD는 두 번째 모멘트가 유한 할 때마다 "의미있는"의미로 정의되며 여기에는 확률 원자 ( "Dirac 델타"함수)가 포함됩니다.
whuber

좋아, 나는 아마도 지나치게 제한적 이었다는 데 동의하지만 일반적으로 이것이 SD의 사람들의 의미입니다. 예를 들어 Wolfram : "표준 편차는 처음 두 모멘트가 유한 한 분포에 대해 정의 할 수 있지만 기본 분포가 정규라고 가정하는 것이 가장 일반적입니다." 그러나 변수 중 하나에 대해 SD = 0 인 경우 상관 관계의 통계적 개념의 기본 가정이 충족되지 않는다는 점을 알고 있습니까?
tdc

네, 톰, 당신의 마지막 진술은 제 자리에 있고 기꺼이 받아들입니다. 그러나, 그것이 표현하는 아이디어는 귀하의 답장에 크게 눈에 띄지 않습니다. 존재하는 경우 정규 분포, 로그, 델타 함수 및 분포 자체가 아닌 데이터에 대한 초점에 대한 설명에 묻혀 있습니다. BTW는 Wolfram 사이트에 나타나는 통계적 진술에주의해야한다. 통계 실무에 대한 그 특성화는 의문의 여지가있을 정도로 수학에 중점을두고있다. SD의 사용은 일반 배포 설정을 뛰어 넘습니다.
whuber

2

상관은 두 벡터 사이의 각도의 코사인입니다. Y에 대한 표준 편차가 0이라고 말하는 것은 벡터 Y- 평균 (Y)이 0 (또는 더 엄격하게는 적절한 벡터 공간에서 0을 나타냄)을 말하는 것과 같습니다. 따라서 문제는 "제로 벡터와 벡터 X- 평균 (X) 사이의 (코사인) 각도에 대해 무엇을 말할 수 있습니까?"입니다. 더 일반적으로, 내부 곱이있는 벡터 공간에서 영 벡터와 다른 벡터 사이의 각도는 무엇을 의미합니까? 내 의견으로는 이것에 대한 답은 하나 뿐이며,이 상황에서 "각도"의 개념은 의미가 없으므로이 상황에서의 상관 관계 개념은 의미가 없다는 것입니다.


0

면책 조항, 나는 이미 받아 들여진 품질 답변이 있다는 것을 알고 있으므로 이것이 응답해야하지만 그것을 허용 할 경험 포인트는 없습니다. @Dilip은 관례에 대해 상관 관계를 0으로 정의 할 수 있다고 언급했지만, 실제로는 0이 아닌 (0이 아닌 SD의 경우) 상관 관계와는 매우 다른 해석을 가지므로 문제가되는 것 같습니다. 원래 질문은 "한 변수의 SD가 0 인 경우"입니다. 우리가 멈추고 '변수'의 정의를 생각하면 대답에 훨씬 더 직접적인 경로를 얻습니다. SD가 0 인 변수는 전혀 변수가 아니며 상수입니다. 따라서이 경우 두 개의 변수가 없으므로 상관 관계를 정의하는 것이 개념적으로 의미가 없습니다.


의견이 충분하지 않으면 답변을 통해 의견을 말해서는 안됩니다.
Michael R. Chernick
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.