두 개의 선형 회귀 모델이 주어지면 어떤 모델이 더 잘 수행됩니까?


14

대학에서 기계 학습 과정을 수강했습니다. 퀴즈 중 하나 에서이 질문을 받았습니다.

모델 1 :

y=θx+ϵ
모델 2 :
y=θx+θ2x+ϵ

위의 모델 중 어느 것이 데이터에 더 적합합니까? (선형 회귀를 사용하여 데이터를 모델링 할 수 있다고 가정)

정답은 (교수에 따르면) 두 모델 모두 똑같이 잘 작동한다는 것입니다. 그러나 첫 번째 모델이 더 적합 할 것이라고 생각합니다.

이것이 내 대답의 이유입니다. , α = θ + θ 2 로 다시 쓸 수있는 두 번째 모델 은 첫 번째 모델과 동일하지 않습니다. α는 사실 포물선이며, 따라서 최소 값 갖는 ( - 0.25 이 경우에는). 이 때문에 첫 번째 모델에서 θ 의 범위는 α 의 범위보다 큽니다.αx+ϵα=θ+θ2α0.25θα 는 두 번째 모델 . 데이터가 가장 적합한보다 경사 덜했다하도록했다 따라서 경우 , 두 번째 모델은 매우 저조한 첫 번째에 비해 수행 할 것입니다. 그러나 가장 적합한 기울기가보다 큰 경우0.25 이면 두 모델 모두 동일하게 작동합니다.0.25

첫 번째 것이 더 좋습니까, 아니면 둘 다 동일합니까?


3
당신이 맞다고 생각합니다. θ + θ 2 (일부 θ ) 로 표현할 수 있는 매개 변수 요구하는 것은 실제로 가능한 α 에 대한 제약을 강제 합니다. 이는 두 번째 모델 이 본질적으로 제한된 최적화 문제이기 때문에 두 번째 모델 이 첫 번째 모델 보다 적은 관계를 표현할 수 있음을 의미합니다 . 당신의 추론은 나에게 확고 해 보입니다. αθ+θ2θα
Matthew Drury

내가 잘못 어디로 갔는지 @MatthewDrury 난 그냥 알아 낸, 아래의 대답은 (그리고 주석)을 살펴 가지고
쿠시을

3
나는 당신의 의견을 보지만, 그것은 가 복잡한 값을 취할 것이라고 가정하는 꽤 심각한 체조 입니다. 교수님과이 문제를 이야기하기 위해 근무 시간에 정식으로 참석하겠습니다. 어느 쪽이든 좋은 토론을 얻을 수 있습니다. θ
Matthew Drury

1
-0.25의 출처는 분명하지 않습니다. 당신은 명확히 할 수 있습니까?
Mad Jack

1
나는 당신의 교수가 2 점 세트에 각 모델에 딱 맞는 방법에 관심이있을 것이다 . 모형 1과 θ = 1을 사용 하면 적합이 완벽하지만 모형 2에서 θ 를 어떻게 추정 하여 완벽하게 적합합니까? {(1,1),(2,2)}θ=1θ
whuber

답변:


9

모델 2는 로 쓸 수 있습니다 . 이것은 하이퍼 파라미터 ( θ , β )에 대해 다른 표기법 만 사용하여 모델 1과 유사 해 보입니다 . 그러나, 모델 1 우리가 쓸 수 θ = ( X

y=(θ+θ2)x+ϵ=βx+ϵ.
θ,β
θ^=(XX)1Xy.

모델 2에서 우리가 갖고 있기 때문에 그러나 당신이 실제로 언급 한 바와 같이 다음의 범위 β는 에 속해야 [ - 0.25 , + ] 에 대한 θ R . 이 두 모델의 차이로 이어질 것입니다.

β=θ+θ2,
β^[0.25,+]θR

따라서 모델 2는 모델 1과는 달리 당신의 계수 추정치를 제약하는 것은이 모델 주목해야한다,이보다 명확하게하기 θ는 제곱 손실 함수 최소화를 통해 얻을 수있다 θ = 인수 θ R ( Y를 - X θ )θ^ 그러나 모델 2 추정치를 통해 얻어진 β =ARGβ - 0.25 (Y-X의β)

θ^=argminθR  (yXθ)(yXθ)=(XX)1Xy.
다른 결과를 초래할 수있는 '' (y-Xβ).
β^=argminβ0.25  (yXβ)(yXβ)

1
θθ+θ2θ

@kush 귀하의 우려를 해결하는 편집 된 응답을 확인하십시오
Wis

1

당신의 추론을 이해하지 못합니다. 당신이 복용하는 경우 :

와이=α엑스+ϵ
와이=θ엑스+ϵ

그리고 추정 αθ 간단한 선형 회귀를 사용하면 α=θ. 더욱이, 방법론이 정확히 동일하기 때문에아르 자형2어느 방정식에서나 얻을 수있는 가치. 기본 가치θ 첫 번째 방정식에서 당연히 다를 것입니다. α=θ+θ2그러나 이것은 적합과 관련이 없습니다.


5
θ 첫 번째 모델에서 범위의 모든 값을 취할 수 있습니다 (,) 하나 α 두 번째 모델에서는 범위 내에서만 값을 취할 수 있습니다. (0.25,). 따라서이 둘을 단순한 선형 회귀 모델로 취급 할 때 계수에 제한을 두지 않습니까?엑스(두 번째 모델에서)? 데이터에 가장 적합한 것이 음의 기울기를 갖는 경우에 문제가되지 않습니까?
kush
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.