답변:
사이의 상관 관계의 차이 무엇입니까 와 및 예측 선형 회귀 에서 ?Y Y X
첫째, 몇 가지 유사점 :
둘째, 몇 가지 차이점 :
lm
과 cor.test
에서 R
, 동일한 p- 값을 산출합니다.
다음은 graphpad.com 웹 사이트에 게시 한 답변입니다 .
상관과 선형 회귀는 동일하지 않습니다. 다음과 같은 차이점을 고려하십시오.
선형 회귀 분석의 단일 예측 변수에서 표준화 된 기울기는 상관 계수와 동일한 값을 갖습니다. 선형 회귀의 장점은 예측 변수의 특정 값이 주어지면 예측 변수에 대한 점수를 예측할 수있는 방식으로 관계를 설명 할 수 있다는 것입니다. 특히 선형 회귀 분석을 통해 예측 변수가 0 일 때 예측 변수의 값인 값이 절편이 아니라는 것을 알 수 있습니다.
요컨대, 그들은 계산적으로 동일한 결과를 생성하지만 간단한 선형 회귀 분석으로 해석 할 수있는 더 많은 요소가 있습니다. 두 변수 사이의 관계의 크기를 단순히 특성화하는 데 관심이있는 경우 상관 관계를 사용하십시오. 결과를 특정 값으로 예측하거나 설명하려는 경우 회귀를 원할 수 있습니다.
상관 관계 분석은 종속 변수 인 독립 변수와 무시하는 두 변수 간의 관계 만 정량화합니다. 그러나 적용 회귀 전에 다른 변수에서 확인할 변수의 영향을 교정해야합니다.
지금까지 제공된 모든 대답은 중요한 통찰력을 제공하지만 한 매개 변수를 다른 매개 변수로 변환 할 수 있다는 것을 잊지 않아야합니다.
회귀 :
회귀 모수와 상관 관계, 공분산, 분산, 표준 편차 및 평균 간의 연결 : b= ˉ y −m ˉ x
따라서 매개 변수의 크기를 조정하고 이동하여 서로 변환 할 수 있습니다.
R의 예 :
y <- c(4.17, 5.58, 5.18, 6.11, 4.50, 4.61, 5.17, 4.53, 5.33, 5.14)
x <- c(4.81, 4.17, 4.41, 3.59, 5.87, 3.83, 6.03, 4.89, 4.32, 4.69)
lm(y ~ x)
##
## Call:
## lm(formula = y ~ x)
##
## Coefficients:
## (Intercept) x
## 6.5992 -0.3362
(m <- cov(y, x) / var(x)) # slope of regression
## [1] -0.3362361
cor(y, x) * sd(y) / sd(x) # the same with correlation
## [1] -0.3362361
mean(y) - m*mean(x) # intercept
## [1] 6.599196
Altman DG 인용, "의료 연구를위한 실용 통계"Chapman & Hall, 1991, 321 쪽 : "상관은 실제 데이터와 직접적인 관계가없는 단일 데이터로 데이터 세트를 줄입니다. 회귀는 훨씬 유용한 방법입니다. 측정 결과와 명확하게 관련된 결과. 관계의 강도는 명백하며, 불확실성은 신뢰 구간 또는 예측 구간에서 명확하게 볼 수 있습니다. "
상관 관계는 관계 강도의 지수 (단 하나의 숫자)입니다. 회귀는 특정 기능적 관계의 적절성에 대한 분석 (모델의 매개 변수 추정 및 유의성에 대한 통계적 테스트)입니다. 상관의 크기는 회귀 예측이 얼마나 정확한지와 관련이 있습니다.
상관 관계는 통계의 용어로, 둘 사이의 관계가 있고 관계의 정도가 있는지를 결정합니다. 범위는 -1에서 +1입니다. 회귀는 평균으로 되돌아가는 것을 의미합니다. 회귀에서 우리는 하나의 변수를 종속적이고 다른 변수를 독립적으로 유지함으로써 가치를 예측하지만 예측하고자하는 변수의 가치를 명확히해야합니다.