상관 관계의 기본 가정과 유의성 회귀 기울기 검정의 차이


21

내 질문은 다른 질문 에 대한 의견에서 @whuber와의 토론에서 자랐습니다 .

구체적으로 @whuber의 의견은 다음과 같습니다.

놀랍게도 한 가지 이유는 상관 관계 테스트와 회귀 기울기 테스트의 기본 가정이 다르기 때문에 상관 관계와 기울기가 실제로 같은 것을 측정한다는 것을 이해하더라도 p- 값이 동일한 이유는 무엇입니까? 이것은 과 가 수치 적으로 같아야하는 것보다 이러한 문제가 어떻게 더 심화되는지를 보여줍니다 .rβ

이것은 그것에 대한 내 생각을 얻었고 다양한 흥미로운 답변을 발견했습니다. 예를 들어, 나는 " 상관 계수의 가정 "이라는 질문을 찾았 지만 위의 설명을 어떻게 명확하게 할 수 있는지 알 수 없습니다.

간단한 선형 회귀 분석에서 Pearson의 과 기울기 의 관계에 대한 더 흥미로운 답변을 찾았 지만 (예를 들어 여기여기 참조 ) @ whuber가 자신의 의견에서 언급 한 것에 대해 대답하지 않는 것 같습니다 (적어도 명백하지 않음) 나에게).rβ

질문 1 : 상관 테스트와 회귀 기울기 테스트의 기본 가정은 무엇입니까?

두 번째 질문에 대해서는 다음 출력을 고려하십시오 R.

model <- lm(Employed ~ Population, data = longley)
summary(model)

Call:
lm(formula = Employed ~ Population, data = longley)

Residuals:
    Min      1Q  Median      3Q     Max 
-1.4362 -0.9740  0.2021  0.5531  1.9048 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   8.3807     4.4224   1.895   0.0789 .  
Population    0.4849     0.0376  12.896 3.69e-09 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.013 on 14 degrees of freedom
Multiple R-squared:  0.9224,    Adjusted R-squared:  0.9168 
F-statistic: 166.3 on 1 and 14 DF,  p-value: 3.693e-09

그리고 cor.test()함수 의 출력 :

with(longley, cor.test(Population, Employed))

    Pearson's product-moment correlation

data:  Population and Employed
t = 12.8956, df = 14, p-value = 3.693e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.8869236 0.9864676
sample estimates:
      cor 
0.9603906 

lm()cov.test()출력에서 볼 수 있듯이 Pearson의 상관 계수 과 기울기 추정값 ( )은 각각 0.96과 0.485가 크게 다르지만 t- 값과 p- 값은 동일합니다.rβ1

그런 다음 β 1 의 t- 값을 계산할 수 있는지 확인하려고했는데 rβ 1 이 다르 더라도 동일 합니다. 그리고 그것은 내가 붙어있는 곳입니다 .rβ1rβ1r

와 의 총 제곱합을 사용하여 간단한 선형 회귀로 기울기 ( )를 계산합니다 .β1xy

x <- longley$Population; y <- longley$Employed
xbar <- mean(x); ybar <- mean(y)
ss.x <- sum((x-xbar)^2)
ss.y <- sum((y-ybar)^2)
ss.xy <- sum((x-xbar)*(y-ybar))

회귀 기울기의 최소 제곱 추정값 ( 's R Book 1st edition , 393 페이지 에 이에 대한 증거가 있음 ).β1

b1 <- ss.xy/ss.x                        
b1
# [1] 0.4848781

대한 표준 오차를 계산하십시오 .β1

ss.residual <- sum((y-model$fitted)^2)
n <- length(x) # SAMPLE SIZE
k <- length(model$coef) # NUMBER OF MODEL PARAMETER (i.e. b0 and b1)
df.residual <- n-k
ms.residual <- ss.residual/df.residual # RESIDUAL MEAN SQUARE
se.b1 <- sqrt(ms.residual/ss.x)
se.b1
# [1] 0.03760029

그리고 대한 t- 값과 p- 값 :β1

t.b1 <- b1/se.b1
p.b1 <- 2*pt(-abs(t.b1), df=n-2)
t.b1
# [1] 12.89559
p.b1
# [1] 3.693245e-09

이 시점에서 내가 모르는 것은 2 번 질문 입니다 1 대신 을 사용하여 동일한 t- 값을 계산하는 방법입니다 (아마도 아기 단계)?rβ1

나는 cor.test()대체 가설이 실제 상관 이 0과 같지 않은지 ( cor.test()위 출력 참조) 인지의 여부에 따라 피어슨 상관 계수 "피어슨 상관 계수의 표준 오차"로 나눈 것과 같은 것을 예상 할 것입니다 . 위) ?! 그러나 표준 오류는 무엇이며 왜됩니까?rb1/se.b1

어쩌면 이것은 상관 관계 테스트와 회귀 기울기 테스트의 기본이되는 전술 한 가정과 관련이 있을까요?!

편집 (2017 년 7 월 27 일) : @whuber가 질문 1 (그리고 부분적으로 질문 2 , 그의 답변 아래 주석 참조)에 대해 매우 자세한 설명을 제공했지만 , 나는이 두 게시물 ( herehere )이 더 깊이 파고 들었 습니다. 특정 표시 표준 오류 에 대한 대답을 잘 작동, 질문 2 에있는 t- 값 주어진 재현하는 것입니다, R을 :rr

r <- 0.9603906
# n <- 16
r.se <- sqrt((1-r^2)/(n-2))
r/r.se
# [1] 12.8956

2
동일하거나 최소한 동등한 테스트입니다. 상관 관계가 0이 아니라는 가설을 기각하면 기울기가 0이 아니라는 가설도 기각합니다.
Michael R. Chernick

6
@Michael 맞아요.하지만 여기에는 많은 잠재적 인 모델 이 있으며 놀랍게도 다릅니다. 그중 하나는 상관 관계에 대한 표준 모델이며, 가장 간단한 방법은 데이터가 알려지지 않은 이변 량 정규 분포의 표본이라는 것입니다. 다른 하나는 X 에 대한 회귀를위한 OLS 모델의 일부 버전으로 , 고정 회귀 및 임의 회귀의 두 가지 특징이 있습니다. 다른 하나는 XY 의 역할을 반대로합니다 . 이러한 가설 검정에 대해 동일한 p- 값을 생성해야한다는 느낌이 든다면 이는 아마도 광범위한 친숙성을 통해서만 가능하지만 직관적으로는 명확하지 않습니다! YXXY
whuber

1
@whuber이 Q가 너무 많이 상향 조정되었지만 만족스러운 답변이 부족하다는 것을 알기 위해 오늘 초에 끝나는 현상금을 시작했습니다. 지금은 유예 기간입니다. 하나의 새로운 답변이 게시되었고 그것은 슬로프 상관 관계 계산을 잘 설명하지만 인용문과 달리 가정에 차이가 없다고 주장합니다. 다른 답변이 없으면 내 현상금이이 새로운 답변에 자동으로 수여됩니다. 자신의 답변을 게시하는 것을 고려할 경우에 대비하여 알려 드리겠습니다.
amoeba는 Reinstate Monica

1
@amoeba 감사합니다; 나는 현상금을 눈치 채지 못했습니다. 나는이 질문을 촉발시킨 발언을 썼을 때 내가 생각했던 것에 대한 부분적인 설명을 게시했다. 나는 그것이 당신이 제안한 방향으로 진전을 나타내기를 바랍니다.
whuber

답변:


5

소개

이 답변은이 질문에 대한 근본적인 동기를 다룹니다.

상관 테스트 및 회귀 기울기 테스트의 기본 가정은 무엇입니까?

그러나 질문에 제공된 배경에 비추어이 질문을 조금 확장하는 것이 좋습니다 . 상관 관계 및 회귀 의 다른 목적개념 을 살펴 보겠습니다 .

상관 관계는 일반적으로 다음과 같은 상황에서 호출됩니다.

  • 데이터는 이변 량입니다. 정확히 두 개의 서로 다른 관심 값이 각 "대상"또는 "관측"과 연관됩니다.

  • 데이터는 관찰 적이다 : 실험자에 의해 설정된 값은 없다. 둘 다 관찰되거나 측정되었다.

  • 변수 사이의 어떤 종류의 관계를 식별, 정량화 및 테스트하는 데 관심이 있습니다.

회귀 가 사용되는 곳

  • 데이터는 이변 량 또는 다변량입니다. 두 가지 이상의 고유 한 관심 값이있을 수 있습니다.

  • 관심사는 다른 하위 집합에 대해 알려진 "독립"변수 또는 "회귀 변수"에 기초하여 변수의 하위 집합 ( "종속"변수 또는 "응답")에 대해 말할 수있는 것을 이해하는 데 중점을 둡니다.

  • 회귀 변수의 특정 값은 실험자에 의해 설정되었을 수 있습니다.

이러한 다른 목표와 상황은 뚜렷한 접근 방식으로 이어집니다. 이 스레드는 유사점에 대해 우려하기 때문에 가장 유사한 경우 인 이변 량 데이터에 중점을 두겠습니다. 두 경우 모두 이러한 데이터는 일반적으로 임의 변수 실현으로 모델링됩니다 . 매우 일반적으로, 두 형태의 분석은이 변수의 비교적 간단한 특성화를 추구합니다.(X,Y)

상관 관계

"상관 분석"은 일반적으로 정의 된 적이 없다고 생각합니다. 상관 계수 계산으로 제한해야합니까, 아니면 PCA, 군집 분석 및 두 가지 변수와 관련된 다른 형태의 분석을 구성하는 것으로보다 광범위하게 고려 될 수 있습니까? 당신의 관점이 좁거나 제한적이든, 당신은 아마도 다음 설명이 적용된다는 데 동의 할 것입니다.

상관 관계 는 변수를 특권을 부여하지 않고 분포에 대해 가정 하고 데이터를 사용하여 해당 분포에 대한보다 구체적인 결론을 도출하는 분석입니다.(X,Y)

예를 들어, 에 이변 량 정규 분포가 있다고 가정 하고 데이터의 피어슨 상관 계수를 사용하여 해당 분포의 모수 중 하나를 추정 할 수 있습니다. 이것은 가장 좁은 (가장 오래된) 상관 관계 개념 중 하나입니다.(X,Y)

또 다른 예를 들어, 당신은 가정에 의해 존재 수 할 수 있는 식별 할 수있는 클러스터 분석 분포를 사용할 K "센터를." 단일 클러스터 이변 량 분포의 혼합물로 의 ( X , Y ) 분포의 분해의 시작으로 해석 할 수있다 .(X,Y)k(X,Y)

이러한 모든 접근 방식에 공통적 인 한 가지는 Y 의 대칭 처리입니다 . 다른 것보다 특권이 없습니다. 둘 다 동등한 역할을합니다.XY

회귀

회귀 는 명확하고 보편적으로 이해되는 정의를 즐깁니다.

회귀의 조건부 분포 특성화 (응답) 소정의 X (회귀 변수 참조).YX

역사적으로, 회귀 분석은 이변 량 정상 데이터 것을 갈톤의 발견에 그 뿌리 (. C 1885) 추적 즐길 선형 회귀 : 조건부 기대 Y가 의 선형 함수입니다 X . 특수 종합 스펙트럼의 한 자극에서 정규 방정식은 (OLS) 회귀의 조건부 분포 어디 Y가 정상인 것으로 가정된다 ( β 0 + β 1 X , σ 2 ) 고정 파라미터 β 0 , β (1) ,σ(X,Y)YXY(β0+β1X,σ2)β0,β1,σ 데이터로부터 추정됩니다.

이 스펙트럼의 매우 일반적인 끝에는 OLS의 모든 측면을 완화하는 일반화 된 선형 모델, 일반화 된 가산 모델 및 기타 다른 것들이 있습니다. 기대, 분산 및 의 조건부 분포의 모양조차도 비선형 적으로 변할 수 있습니다 와 X . 이 모든 일반화에서 살아남은 개념은 YX 에 어떻게 의존 하는지 이해하는 데 관심이 남아 있다는 것 입니다. 그 근본적인 비대칭 성은 여전히 ​​존재합니다.YXYX

상관과 회귀

하나의 매우 특별한 상황은 두 가지 접근 방식에 공통적이며 자주 발생하는 이변 량 정규 모형입니다. 이 모델에서 데이터의 산점도는 고전적인 "축구", 타원형 또는 시가 모양을 가정합니다. 데이터는 직교 축 쌍 주위에 타원으로 분산됩니다.

  • 상관 관계 분석은 주축 주위의 상대적으로 작은 확산이 "강하다"는 점에서이 관계의 "강도"에 중점을 둡니다.

  • 위에서 언급했듯이 X 에서 Y 의 회귀 (및 마찬가지로 에서 X 의 회귀 )는 선형 입니다. 반응의 조건부 기대는 회귀의 선형 함수입니다.YXXY

(이 두 설명 사이의 명확한 기하학적 차이를 숙고 할 가치가 있습니다. 기본적인 통계적 차이를 밝힙니다.)

5 개의 이변 량 정규 모수 (두 개의 평균, 두 개의 산포 및 두 개의 변수 사이의 의존성을 측정하는 하나) 중 하나가 공통 관심사입니다 : 다섯 번째 모수 . 직접적이고 간단하게ρ

  1. 계수 의 회귀 Y 에서 X .XYX

  2. 계수 의 회귀 XY .YXY

  3. 회귀 분석 ( 2 ) 중 하나의 조건부 분산 .(1)(2)

  4. 타원 축 주위 의 스프레드 ( 분산으로 측정).(X,Y)

상관 관계 분석은 XY 의 역할을 구분하지 않고 에 중점을 둡니다 .(4)XY

회귀 분석은 회귀 변수 및 반응 변수 선택에 적합한 ~ ( 3 ) 버전에 중점을 둡니다 .(1)(3)

두 경우 모두 가설 은 특별한 역할을 수행합니다. 이는 X에 대한 Y의 변동이 없을뿐만 아니라 상관도 없음을 나타냅니다 . 확률 모델과 귀무 가설 모두 상관 관계 및 회귀에 공통적 (이 간단한 상황에서) 때문에 두 방법 모두 ( "이라고 여부 같은 통계에 관심을 공유하는, 그것은 놀라운 일이 아니다 R "또는 " β "); 이러한 통계의 널 샘플링 분포는 동일합니다. (따라서) 가정 테스트는 동일한 p- 값을 생성 할 수 있습니다.H0:ρ=0YXrβ^

다른 사람이 처음으로 배우는이 일반적인 응용 프로그램은 개념과 목표가 얼마나 다른 상관 관계와 회귀인지를 인식하기 어렵게 만들 수 있습니다. 기본적인 차이점이 드러나는 것은 일반화에 대해 배울 때만 가능합니다. 클러스터 분석을 "회귀"의 형태로 구성하기 어려운 것처럼 GAM을 "상관"에 대한 많은 정보를 제공하는 것으로 해석하기는 어렵습니다. 두 가지는 서로 다른 목적을 가진 서로 다른 절차 군으로, 각각 적절하게 적용될 때 자체적으로 유용합니다.


나는이 오히려 일반 다소 모호 검토하는 몇 가지 방법을 조명했다 바란다 "이러한 문제는 단순히 여부보다 더 깊게 β가 수치 적으로 동일해야합니다." 이러한 차이점을 이해함으로써 다양한 기술이 달성하려고하는 것을 이해하고 통계 문제를 해결하는 데 더 잘 활용할 수있었습니다.rβ^


이 통찰력있는 답변에 대해 whuber에게 감사드립니다! @ matt-barstead의 답변에 대한 의견에서 언급했듯이, 나는 두 번째 질문과 관련 하여 에 대한 표준 오류를 발견했습니다 . 비록 내가 이해하지 못하는 것은 그것이 어떻게 파생되고 왜 ( 여기 의 질문과 유사 )아르 자형
Stefan

1
대한 SE 는 ( X , Y ) 가 이변 량 정규 분포와 같은 특정 분포 가정을 통해서만 도출 할 수 있습니다 . 이 시점에서 그것은 적분 미적분학의 연습입니다.이 질문에 대해서는 추구해야 할 일이 아닙니다. r 의 분포는 Wikipedia에 의해 인용되었으며 stats.stackexchange.com/a/85977/919 내 게시물에서 (기하학적으로) 파생 됩니다. 아르 자형(엑스,와이)아르 자형
whuber

나는 다른 시간 동안이 웜 캔을 남겨 둘 것입니다 :) 귀하의 의견에 감사드립니다 @whuber!
Stefan

3

@ whuber의 대답에서 알 수 있듯이 회귀 세계에서 명확한 아날로그가없는 그와 유사한 상관 관계가있는 많은 모델과 기술이 있으며 그 반대도 마찬가지입니다. 그러나 사람들이 회귀와 상관 관계를 생각하고 비교하고 대조 할 때 실제로 동일한 수학적 동전의두면 (일반적으로 선형 회귀와 피어슨의 상관 관계)을 고려합니다. 그들이 두 가지 분석 군에 대해 더 넓은 관점을 가져야하는지 여부는 별도의 논쟁이며, 연구자들은 최소한 최소한으로 씨름해야합니다.

궁극적으로 가장 일반적인 응용 분야에서 상관 관계 및 회귀를 평가할 때 ( x , y ) 의 특정 분포 속성을 지정하기 위해 y 의 선형 변환을 제외하고 수학적으로는 아니지만 두 가지 사이에 개념적 차이가 있습니다. .xy(x,y)

회귀와 상관 관계에 대한이 좁은 관점에서 다음 설명은 추정치, 표준 오차 및 p 값이 본질적으로 서로 다른 방법과 이유를 설명하는 데 도움이됩니다.

데이터 프레임 datlongley위에서 참조한 데이터 세트 인 경우 cor.test에 대해 다음을 얻습니다. (위의 질문을 건너 뛰고 답을 바로 읽지 않으면 여기에 새로운 것은 없습니다.)

> cor.test(dat$Employed, dat$Population)

    Pearson's product-moment correlation

data:  dat$Employed and dat$Population
t = 12.896, df = 14, p-value = 3.693e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.8869236 0.9864676
sample estimates:
      cor 
0.9603906 

선형 모델의 경우 다음과 같습니다 (위와 동일).

> summary(lm(Employed~Population, data=dat))

Call:
lm(formula = Employed ~ Population, data = dat)

Residuals:
    Min      1Q  Median      3Q     Max 
-1.4362 -0.9740  0.2021  0.5531  1.9048 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   8.3807     4.4224   1.895   0.0789 .  
Population    0.4849     0.0376  12.896 3.69e-09 ***
---
Signif. codes:  
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.013 on 14 degrees of freedom
Multiple R-squared:  0.9224,    Adjusted R-squared:  0.9168 
F-statistic: 166.3 on 1 and 14 DF,  p-value: 3.693e-09

이제이 답변에 대한 새로운 구성 요소가 있습니다. 먼저, 두 개의 표준화 된 버전 EmployedPopulation변수를 새로 만듭니다 .

> dat$zEmployed<-scale(dat$Employed)
> dat$zPopulation<-scale(dat$Population)

두 번째로 회귀를 다시 실행하십시오.

> summary(lm(zEmployed~zPopulation, data=dat))

Call:
lm(formula = zEmployed ~ zPopulation, data = dat)

Residuals:
     Min       1Q   Median       3Q      Max 
-0.40894 -0.27733  0.05755  0.15748  0.54238 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2.956e-15  7.211e-02     0.0        1    
zPopulation  9.604e-01  7.447e-02    12.9 3.69e-09 ***
---
Signif. codes:  
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.2884 on 14 degrees of freedom
Multiple R-squared:  0.9224,    Adjusted R-squared:  0.9168 
F-statistic: 166.3 on 1 and 14 DF,  p-value: 3.693e-09

짜잔! 회귀 기울기는 위의 상관 계수와 같습니다. 질문 1에 대한 답 은 두 테스트에 대한 가정이 본질적으로 동일하다는 것입니다.

  1. 관측의 독립
  2. 의 선형 관계xy
  3. eN(0,σe2)
  4. 오차항은 회귀선의 각 예측값에 유사하게 분포됩니다 (즉, 오차 분산의 동질성)

xy

들어 질문 2 ,의합니다 (R 코드에서 암시 -하지만 크게 아래에 명시된) 이상 사용하는 회귀 기울기 식의 표준 오차 시작하자 :

b=(XiX¯)(YiY¯)(XiX¯)2

bVar(b)Xi=(XiX¯)Yi=(YiY¯)

Var(b)=Var((XiYi)(Xi2))

이 공식에서 다음과 같이 요약되고 더 유용한 표현을 얻을 수 있습니다 ( 단계별이 링크 참조 ).

Var(b)=σe2(XiX¯)2
SE(b)=Var(b)=σe2(XiX¯)2

σe2

비 표준화 및 표준화 된 (즉, 상관 관계) 선형 모델에 대해이 방정식을 풀면 경사에 대해 동일한 p 및 t 값을 얻을 수 있다고 생각합니다. 두 테스트 모두 보통 최소 제곱 추정에 의존하며 동일한 가정을합니다. 실제로 많은 연구자들이 단순한 선형 회귀 모델과 상관에 대한 가정 검사를 건너 뛰지 만, 많은 사람들이 간단한 선형 회귀의 특수 사례로 인식하지 않기 때문에 상관 관계에 대해 그렇게하는 것이 훨씬 더 일반적이라고 생각합니다. (참고 :이 방법은 채택하지 않는 것이 좋습니다)


2
이 답변은 질문에 재현 된 @ whuber의 인용문을 다루지 않으며 가정이 다르다고 주장합니다. 이 진술이 잘못되었다는 말입니까?
아메바는 모니카의 복원 고 모니카

이 방정식을 따르는 경우 Pearson의 상관 관계는 단순한 선형 회귀에 대한 동일한 기본 가정을 갖습니다. 더 명확하게 설명하기 위해 내 답변을 수정할 수 있습니다.
Matt Barstead

1
답변 감사합니다! 표준화되었을 때 상관 계수가 회귀 기울기와 같다는 것을 알고있었습니다. 이것은 내 질문에 링크 3과 4에 표시되었습니다. 나는 또한 당신이 열거 한 일반적인 가정을 알고 있었기 때문에 @whuber의 의견에 따라이 질문으로 이어졌습니다. 나는 내가 알고있는 가정-사과를 명시 적으로 언급해야합니다.
Stefan

1
rrr <- 0.9603906; n <- 16; r/(sqrt((1-r^2)/(n-2))) # 12.8956

0

다음은 검정의 동등성에 대한 설명이며 r과 b의 관계를 보여줍니다.

http://www.real-statistics.com/regression/hypothesis-testing-significance-regression-line-slope/

OLS를 수행하려면 https://en.wikipedia.org/wiki/Ordinary_least_squares#Assumptions 를 만들어야합니다.

또한 OLS와 corr은 랜덤 샘플링을 가정합니다.

corr 테스트 구성은 다음을 가정합니다.

(x, y) 모집단의 "무작위 및 충분히 큰 표본"이 있습니다.


0

질문 2에 대해

β1 대신 r을 사용하여 동일한 t- 값을 계산하는 방법

trFr

F=r2/k(1r2)/(nk)

k=2n=datapoints

제한으로

... 모델에 절편이없는 경우 F 비율을 사용할 수 없습니다

출처 : 다중 회귀 모형의 가설 검정


1
나는 당신이 어떤 질문에 대답하고 있는지 확인하기 위해 원래 게시물을 되돌아 보았습니다. 1 (가정에 대해)과 2 (t- 값 계산에 대해)로 번호가 매겨진 2 개를 찾았지만이 답변으로 해결되지 않는 것 같습니다. 어떤 질문에 대답하고 있는지 더 명확하게 말씀해 주시겠습니까?
whuber

1
설명해 주셔서 감사합니다. 이제 질문과의 연결이 분명합니다. 그래도 질문을 다르게 해석합니다. 상관 관계 분석을위한 p- 값 (즉, 샘플 상관 계수를 기반으로하는 방법)을 묻습니다.아르 자형그리고 그것이 암시하는 모델을 계산합니다 (그리고 회귀 분석에 동일한 값을 가져야하는 이유를 명시 적으로 보여주기 위해). 당신의 대답은 정확하지만 회귀에 기초하기 때문에 여전히 궁금합니다.
우버

1
나는 아마도 일반적인 것이 아니라 구체적인 경우에 질문에 대답하고 있다고 생각합니다. 나는 내가 고군분투하고있는 것처럼이 일반적인 경우를 고려할 수있는 일반적인 null 및 대체 가설의 관점에서 질문을 진술하는 것이 유용 할 것이라고 생각합니다.
Harry Salmon

나는 상관 관계와 회귀 분석을위한 명확한 모델과 결정 기준을 제시하는 것이 그것들을 구별하는데 큰 도움이 될 것이라고 동의한다. 좋은 답변은 질문을 재구성하거나 명확하게하는 것 이상으로 구성되는 경우가 많으며, 가장 좋은 답변은 효과적인 질문을 다시 시작하는 것으로 시작되므로 그 방향으로 나아가는 것을 두려워하지 마십시오.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.