관계가 선형인지 비선형인지 확인하기위한 통계 테스트


9

다음과 같은 예제 데이터 세트가 있습니다.

Volume <- seq(1,20,0.1)
var1 <- 100 
x2 <- 1000000
x3 <- 30

x4 = sqrt(x2/pi)
H = x3 - Volume
r = (x4*H)/(H + Volume)

Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r))

Power <- jitter(Power, factor = 1, amount = 0.1)
plot(Volume,Power)

여기에 이미지 설명을 입력하십시오

그림에서 볼 때 특정 범위의 '볼륨'과 '파워'사이의 관계는 선형이고, '볼륨'이 상대적으로 작아지면 관계가 비선형이된다는 것을 알 수 있습니다. 이것을 설명하기위한 통계 테스트가 있습니까?

OP에 대한 응답에 표시된 권장 사항 중 일부와 관련하여 :

여기에 표시된 예는 단순히 예일뿐입니다. 노이즈가 많지만 여기에 표시된 관계와 비슷한 데이터 세트가 보입니다. 지금까지 수행 한 분석에 따르면 특정 액체의 부피를 분석하면 부피가 작을 때 신호의 힘이 크게 증가합니다. 즉, 볼륨이 15와 20 사이 인 환경 만 있으면 선형 관계처럼 보입니다. 그러나 더 작은 볼륨을 가진 포인트의 범위를 늘림으로써 관계가 전혀 선형이 아님을 알 수 있습니다. 통계적으로 이것을 보여주는 방법에 대한 통계적 조언을 찾고 있습니다. 이것이 의미가 있기를 바랍니다.


5
여기에는 몇 가지 일이 있습니다. 첫째는 물론 관계는 변수의 범위를 적절하게 제한되어 제공 선형 볼 것이다. 둘째, 데이터 의 이분산성 은 비선형 관계만큼이나 두드러진 특징입니다. 즉, 산란은 소량 및 고전력보다 대용량과 저전력에서 더 큽니다. 그럼에도 불구하고 정확히 무엇을 테스트하고 싶습니까? 전체 범위에서 관계의 선형성?
whuber

4
실제로, 나는 이분산성 (heteroscedasticity)에 대한 언급을 되풀이하고 싶습니다 : 줄거리는 그러한 모습 을 보여 주지만, 더 적은 양에서 상대적으로 가파른 경사로 인한 환상입니다. (그러나 권력의 관점에서 볼 때, 이분법 적 관계는 극도로 이분법 적 관계가있다.) 일단 우리가 이분법 적이 지 않다고 판단되면 , 이것은 일종의 분석을 배제하고 (우리는 그 힘의 비선형 변환을 적용하고 싶지 않을 것이다) 비선형 성이 명확 해지면 다른 사람 (예 : 비선형 최소 제곱 또는 일반 선형 모형)을 선호합니다.
whuber

이제 문제에 대한 간단한 설명을 추가했습니다. 지금까지 의견을 보내 주셔서 감사합니다. 의견을 보내 주셔서 감사합니다.
KatyB

왜 이차 효과를 테스트하지 않습니까?
AdamO

2
@ 사이먼 나는 어떤 테스트를 사용하지 않았지만, 그럼에도 불구하고 당신은 할 수 있습니다 이 볼륨에 대한 잔차의 전형적인 크기를 플롯하여 homoscedastic입니다. R코드는 다음과 같습니다 plot(s <- by(cbind(Power, Volume), groups <- cut(Volume, 10), function(d) summary(lm(Power ~ Volume, data=d))$sigma), xlab="Volume range", ylab="Residual SD", ylim=c(0, max(s))); abline(h=mean(s), lty=2, col="Blue").. 전체 범위에서 거의 일정한 잔차 크기를 보여줍니다.
whuber

답변:


4

이것은 기본적으로 모델 선택 문제입니다. @whuber가 지적한 이분산성 문제를 염두에두고 물리적으로 타당한 모델 (선형, 지수, 아마도 불연속 선형 관계)을 선택하고 Akaike Information Criterion 또는 Bayesian Information Criterion을 사용하여 최선을 선택하는 것이 좋습니다.


2

인터넷 검색을 시도 했습니까? 이를 수행하는 한 가지 방법은 모형에 더 높은 검정력 또는 기타 비선형 항을 맞추고 계수가 0과 크게 다른지 테스트하는 것입니다.

여기에 몇 가지 예가 있습니다 http://www.albany.edu/~po467/EPI553/Fall_2006/regression_assumptions.pdf

귀하의 경우 데이터 세트를 두 섹션으로 분할하여 볼륨 <5의 비선형 성과 볼륨> 5의 선형성을 테스트 할 수 있습니다.

또 다른 문제는 데이터가 이분산성이므로 회귀 데이터의 정규성 가정을 위반한다는 것입니다. 제공된 링크는이를 테스트하는 예제도 제공합니다.


링크가 끊어졌습니다.
Jatin

2

하나의 모델을 모든 데이터에 맞추기 위해 비선형 회귀를 사용하는 것이 좋습니다. 임의의 볼륨을 선택하고 하나의 모델을 그보다 적은 볼륨에 맞추고 다른 모델을 더 큰 볼륨에 맞추는 요점은 무엇입니까? 5를 예리한 임계 값으로 사용하는 이유는 무엇입니까? 특정 볼륨 임계 값 이후에 이상적인 곡선이 선형이라고 생각하십니까? 볼륨이 증가함에 따라 수평에 근접 할 가능성이 더 높지 않지만 결코 선형 적이지는 않습니까?

물론, 분석 도구의 선택은 어떤 과학적 질문에 답하려고하고 시스템에 대한 사전 지식에 의존해야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.