데이터가 선형이 아닌 경우 선형 회귀가 중요 할 수 있습니까?


11

선형 회귀 분석을 수행하여 중요한 결과를 얻었지만 산점도에서 선형성을 검사했을 때 데이터가 선형임을 확신하지 못했습니다.

산점도를 검사하지 않고 선형성을 테스트하는 다른 방법이 있습니까?

선형 회귀가 선형이 아닌 경우 중요 할 수 있습니까?

[산점도를 포함하도록 편집]

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오


3
여러 질문에 대한 해석과 여러 답변이있을 수 있습니다 (그러나 기본적으로 모든 경우에 대답은 그렇습니다. 결과 증명으로 확실히 가능합니다). 산점도를 보여줄 수 있습니까? 그런 다음 다른 사람들은 데이터가 선형 적이 지 않다는 의미와 의미있는 결과가 어쨌든 존재한다는 것을 이해할 수 있습니다.
Sextus Empiricus

5
고전적인 간단한 예제는 stats.stackexchange.com/search?q=anscombe+quartet 를 참조하십시오 . 에서 stats.stackexchange.com/a/152034/919 나는 옷에 당신이 생각할 수있는 거의 모든 상황을 예를 구성 할 수있는 알고리즘을 기록했다.
whuber

물론 비선형 성을 무시 하면 일반적인 추세가 선형 일 때에도 적용에서 추론이 손상 될 수 있습니다. 예를 들어, 진정한 관계가 급격히 떨어지고 를 가로 질러 평평 해지는 경우 ,의 선형 해석은 가 모든 값 에 대해 평균 금액만큼 하락하는 반면, 진정한 관계는 훨씬 더 급격히 떨어진다 는 것입니다 범위가 훨씬 좁아 지고 나머지 범위에 걸쳐 영향을받지 않습니다. 선형 해석은 임상 치료 효과 또는 정책 지출 효과에 좋지 않습니다. 와이엑스와이엑스와이엑스엑스
Alexis

또한 선형 회귀 는 중요하지 않거나 오히려 , , , 는 어느 정도 독립된 의미를 가질 수 있습니다. H0:β0=H0:β엑스=H0:에프=H0:아르 자형2=
Alexis

느린 응답에 대한 답변과 사과에 감사드립니다-저는 기술에서 벗어났습니다! 중요한 회귀 분석에 대한 산포도를 포함하도록 게시물을 편집했습니다. 진행하는 방법에 대한 조언은 대단히 감사하겠습니다.
IntoTheBlue

답변:


18

단조 비선형 관계는 선형 모델로 모델링 할 때 거의 항상 중요하게 나타납니다. 관계가 비선형적이고 단조롭지 않은 경우 샘플에 따라 다릅니다.

단조 관계의 예는 로그 및 과 같은 홀수 입니다. 단조롭지 않은 관계의 예는 거듭 제곱 및 와 같은 삼각 함수 입니다.와이=ln엑스와이=엑스와이=엑스2와이=엑스

예를 들어, 귀하의 샘플에 대한 경우 , 다음 로 모델링 가능성이 중요 할 것, 줄거리를 참조하십시오엑스[1,1]와이=엑스와이엑스

여기에 이미지 설명을 입력하십시오

그러나 샘플이 인 경우 선형 모델링이 전혀 작동하지 않습니다. 엑스[0,π]여기에 이미지 설명을 입력하십시오


13
+1. 그러나 올바른 용어는 "단어"입니다. "Monotonous"는 반복을 통해 둔하고 지루함을 의미합니다.
whuber

22
@whuber, 내 대답을 편집했지만 부력과 즐거운 비해 가 둔하고 지루 하다는 것에 동의해야합니다. ln엑스엑스
Aksakal

+1 또한 단조로운 의미를 정의하는 것이 좋습니다.
Mark White

감사합니다. 산점도를 포함하도록 게시물을 업데이트했습니다. 진행하는 방법에 대한 조언은 대단히 감사하겠습니다.
IntoTheBlue

(엑스엑스¯)2

3

그렇습니다. Aksakal은 옳으며, 진정한 관계가 비선형 인 경우 선형 회귀가 중요 할 수 있습니다. 선형 회귀는 데이터에 가장 잘 맞는 선을 찾아 경사가 0과 크게 다른지 여부를 간단히 테스트합니다.

비선형성에 대한 통계 테스트를 찾기 전에 먼저 모델링 할 대상을 반영하는 것이 좋습니다. 두 변수 사이에 선형 (비선형) 관계가 예상됩니까? 정확히 무엇을 찾으려고합니까? 예를 들어 자동차 속도와 제동 거리 사이에 비선형 관계가 있다고 가정하는 경우 독립 변수의 제곱 항 (또는 다른 변형)을 추가 할 수 있습니다.

또한 데이터의 육안 검사 (산점도)는 매우 강력한 방법이며 분석의 첫 단계입니다.


와이엑스

CV에 오신 것을 환영합니다, Pawel!
Alexis

2
@Alexis 당신이 맞아요. 그러나 일부 텍스트에서 비선형 성을 확인하는 빠르고 더러운 방법으로 2 차 항을 추가하는 것이 여전히 일반적으로 권장되는 방법입니다 (아무도 비선형 성을 모델링하는 유일한 방법이라고 제안하는 사람은 아무도 없습니다). 그 구절에 대해 걱정하지 않았습니다.
whuber

+1 @whuber 슬프게도, 많은 연구자, 학생 및 교직원이 산포도를 "비선형 성을 테스트하는 방법"으로 시선을 넘어선 첫 번째 점검으로 2 차 항을 추가하는 연습을 겪었으며 부정적인 결과는 "선형이면 충분합니다." ". (Quadratic 용어는 실제로 유용 할 수 있고, 나는 그것을 내 자신의 연구에 사용했다. :) 나는 "빠르고 더러운"에 대한 나의 관점은 쉽게 가르치는 것들이 압도적 인 대다수의 연구자들에게 엄격 하다는 것입니다 . .. 비모수 적 회귀는 선형적이고 "탐색하기위한 더 좋은 도구"처럼 "쉬운"것 같습니다.
Alexis

@Alexis 감사합니다. 당신이 나를 오해했다고 생각합니다. 비선형 성을 테스트하기 위해 제곱 항을 추가하는 것은 권장하지 않았지만 제곱 항 (또는 다른 변형, 경제 데이터는 종종 로그 변환)에 대한 사례가있을 수 있습니다. 탐색 적 분석과 설명 적 분석 사이에는 구별이 필요하다고 생각합니다. 제곱 관계를 가정 할 근거가있는 경우이를 테스트해야합니다. 당신이 제안하는 것은 더 탐구적인 접근입니다.
Pawel

-2

나는 Aksakal가 말하는 모든 것에 동의합니다. 그러나 첫 번째 질문에 대한 답은 상관 관계라고 생각합니다. 상관은 데이터 세트 x와 y 사이에 선형 관계가있는 정도를 측정합니다.


2
와이=ln엑스

@ gung 그래. 그의 어떤 진술이 틀렸다고 생각하십니까? Aksakal의 대답에서와 같이 선형 및 비선형이라는 단어의 의미를 이해하고 정확하고 비선형 관계가있는 변수의 예를 찾기가 쉽다는 것을 제안 할 수 있습니다. 그럼에도 상관 관계는 선형 관계의 척도이며 +/- 1의 상관 관계는 관계가 실제로 선형임을 의미합니다. 그보다 작은 상관 관계는 관계가 (정확히는) 선형이 아니지만 충분히 가깝다는 것을 의미합니다.
meh

1
OP는 "중요한 결과를 도출 한 선형 회귀를 수행했지만"산점도는 관계가 선형이 아님을 암시했습니다. 실제로 회귀 분석에 1 개의 X 변수 만있는 경우 회귀의 p- 값과 상관 관계는 동일 할 것입니다. 그러나 중대한 회귀에도 불구하고 관계가 선형이 아닌 경우, 유의 한 상관 관계에도 불구하고 여전히 선형이 아닙니다. 따라서 중요한 상관 관계는 관계가 선형이라는 증거가 아닙니다.
gung-모니 티 복원

1
아르 자형=1아르 자형=1아르 자형1

1
이것은 지나치게 미묘하거나 심지어는 따끔 거리는 소리로 들릴 수도 있지만 (a) 상관 관계는 이변 량 관계의 선형성을 측정하는 방법이라는 데 동의합니다. 비선형 성 을 평가하는 매우 조잡한 방법 이상으로 해석 될 수 있습니다 . 비선형 성의 증거는 절대 샘플 상관이 높은 데이터 세트에서 두드러 질 수 있고, 절대 절대 상관이 작은 데이터 세트에는 전혀 없을 수 있습니다. (cc @gung)
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.