변수의 로그 변환 전후에 상관 관계


9

로그 변환을 수행하기 전에 또는 후에 두 개의 임의 변수 X 및 Y에 대해 피어슨 상관 관계를 계산해야하는지에 대한 일반적인 원칙이 있습니까? 테스트하기에 더 적합한 절차가 있습니까? 로그 변환은 비선형이므로 유사하지만 다른 값을 생성합니다. 로그 후 X 또는 Y가 정규성에 더 가까운 지 여부에 따라 달라 집니까? 그렇다면 왜 중요합니까? 그리고 그것은 pearson (x, y)가 pearson (log (x), log ( 와이))?


@vinux는 좋은 답변을 제공하며 상관 관계에서 정규성의 역할을 이해하기위한 정보 링크를 제공합니다. 나는이 질문을 지적하고 싶었습니다 : stats.stackexchange.com/questions/298 이것은 회귀에서 로그가 무엇을하는지 이해하는 데 매우 좋습니다.
gung-복원 Monica Monica

답변:


5

때문에 와 데이터의 단순 변환입니다 와 , 당신은 또한 사용하도록 선택할 수 있습니다 스피어 만의 순위 상관 관계 ( 당신이 얻을 것이다로서, 데이터를 변환에 대해)이 아닌 걱정을log(X)log(Y)XYρSρS(X,Y)=ρS(log(X),log(Y))


4

상관 (피어슨)은 두 연속 변수 사이의 선형 관계를 측정합니다. (X, Y) 또는 (log X, log Y)에는 그러한 선택이 없습니다. 변수의 산점도를 사용하여 관계를 이해할 수 있습니다.

다음 링크는 정규성 문제에 대한 답변입니다. 링크


-3

Pearson 상관 관계는 파라 메트릭 테스트를위한 것이며 비모수 테스트보다 강력합니다. 따라서 비모수 적 절차 전에 변환을 사용하도록 선택합니다. 데이터를 변환하고 피어슨 상관 관계를 얻으십시오. 그게 다야.


@ abi : 표본 크기에 따라 Spearman과 Kendall의 계수는 정규 분포 데이터를 사용하는 Pearson과 전력 및 MSE가 상대적으로 유사하며 약간의 데이터 오염으로 훨씬 우수합니다.
패트릭
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.