나는 4 개의 변수로 회귀를 실행했으며 T 값이 및 모든 통계적으로 매우 중요 합니다 (십진수를 포함하지 않는 것처럼 보이므로 라고 말합니다 ). 매우 높고 명확합니다. 그러나 는 단지 .2284입니다. 여기서 t 값을 잘못 해석하여 그렇지 않은 것을 의미합니까? t 값을 보았을 때의 첫 번째 반응은 가 상당히 높을 것이지만 아마도 가 높은 것일까 요?
나는 4 개의 변수로 회귀를 실행했으며 T 값이 및 모든 통계적으로 매우 중요 합니다 (십진수를 포함하지 않는 것처럼 보이므로 라고 말합니다 ). 매우 높고 명확합니다. 그러나 는 단지 .2284입니다. 여기서 t 값을 잘못 해석하여 그렇지 않은 것을 의미합니까? t 값을 보았을 때의 첫 번째 반응은 가 상당히 높을 것이지만 아마도 가 높은 것일까 요?
답변:
-values 및 매우 다른 일을 판단하는 데 사용됩니다. -values은중인 추정치의 accurary 판단하는 데 사용되는 의, 그러나 응답 변수 변동의 측정 량은 공변량으로 설명한다. 관측치 로 회귀 모형을 추정한다고 가정합니다 .
여기서 , .
큰 값 (절대 값)은 이라는 귀무 가설을 기각합니다 . 이는 계수의 부호를 정확하게 추정했음을 확신 할 수 있음을 의미합니다. 또한 > 4이고 이면 0은 계수에 대해 99 % 신뢰 구간에 있지 않습니다. 계수에 대한 -value 추정치 간의 차이 및 표준 오차로 정규화 0 .
이것은 단순히 추정치를 변동성의 척도로 나눈 것입니다. 충분히 큰 데이터 집합이있는 경우 항상 통계적으로 유의 한 (큰) 있습니다. 그렇다고 공변량이 반응 변수의 변동을 설명한다는 의미는 아닙니다.
@Stat에서 언급했듯이 는 종속 변수로 설명되는 반응 변수의 변동량을 측정합니다. 에 대한 자세한 내용은 Wikipedia 로 이동하십시오 . 귀하의 경우, 를 정확하게 추정하기에 충분히 큰 데이터 세트가있는 것으로 보이지만 공변량은 반응 값을 설명 및 / 또는 예측하는 데 좋지 않습니다.
caburke와 동일하지만 더 간단히 말하면 변수로 인한 평균 반응이 0이 아니라고 확신합니다. 그러나 회귀 분석에 포함되지 않은 응답이 많이 발생하는 다른 많은 것들이 있습니다.
Could it be that although your predictors are trending linearly in terms of your response variable (slope is significantly different from zero), which makes the t values significant, but the R squared is low because the errors are large, which means that the variability in your data is large and thus your regression model is not a good fit (predictions aren't as accurate)?
Just my 2 cents.
Perhaps this post can help: http://blog.minitab.com/blog/adventures-in-statistics/how-to-interpret-a-regression-model-with-low-r-squared-and-low-p-values
작은 R 제곱을 처리하는 유일한 방법은 다음을 확인하십시오.
모형 추정에 얼마나 많은 공변량을 사용 했습니까? 귀하의 경우와 같이 1보다 많은 경우 공변량의 다중 공선 성 문제를 처리하거나 간단히 베타 제로라는 상수없이 이번에는 회귀를 다시 실행하십시오.
However, if the problem still persists, then do a stepwise regression and select the model with a high R squared. But which I cannot recommend to you because it brings about bias in the covariates