여기 몇 가지 문제가 있습니다.
(1) 모델은 명시 적으로 확률 적이어야 합니다. 거의 모든 경우 에 lhs가 모든 데이터의 rhs와 일치하는 매개 변수 세트 가 없습니다 . 잔차가 있습니다. 이러한 잔차에 대해 가정해야합니다. 평균적으로 0이 될 것으로 예상합니까? 대칭 적으로 분포 되려면? 대략 정규 분포되어 있습니까?
다음은 지정된 모델과 일치하지만 크게 다른 잔차 동작을 허용하는 두 가지 모델입니다 (따라서 일반적으로 다른 모수 추정치가 발생 함). 의 공동 분포에 대한 가정을 다양하게 변경하여 이러한 모델을 변경할 수 있습니다 .ϵ나는
B : y i = β 0 exp ( β 1 x 1 i + … + β k x k i ) + ϵ 나는 .
A : y 나는= β0특급( β1엑스1 나는+ … + β케이엑스케이 난+ ϵ나는)
B : y 나는= β0특급( β1엑스1 나는+ … + β케이엑스케이 난) + ϵ나는.
와이나는와이나는^
(2) y에 대한 0 값을 처리 할 필요성 은 언급 된 모델 (A)가 임의의 오류가 무엇이든 상관없이 0 값을 생성 할 수 없기 때문에 잘못되었거나 부적절하다는 것을 의미 합니다 . 위의 두 번째 모델 (B)은 y의 0 (또는 음수) 값을 허용합니다. 그러나 그러한 기준에 따라 모델을 선택해서는 안됩니다. # 1을 되풀이하려면 : 오류를 합리적으로 잘 모델링하는 것이 중요합니다.
(3) 선형화는 모델을 변경합니다 . 일반적으로 (A)와 같지만 (B)와 같은 모델이 아닙니다. 이 변화는이 변화가 매개 변수 추정치에 눈에 띄게 영향을 미치지 않을 것이라는 것을 알기에 충분히 데이터를 분석 한 사람들과 사용중인 일에 대해 무지한 사람들에 의해 사용됩니다. (차이를 말하기는 여러 번 어렵습니다.)
와이
에프( y나는)θ제이~ F( θ ) ;= βj 0+ βj 1엑스1 나는+ ⋯ + βj k엑스케이 난
θ F θ 1 , … , θ j f y Pr F θ [ f ( Y ) ≤ t ] ( 1 − θ j + 1 ) F θ ( t ) t ≠ 0홍보에프θ[ f( Y) = 0 ] = θj + 1> 0θ에프θ1, … , θ제이에프와이홍보에프θ[ f( Y) ≤ t ]( 1 − θj + 1) Fθ( t )t ≠ 0
(5) 모델 구성 및 피팅 문제는 관련이 있지만 다릅니다 . 간단한 예로, 일반 회귀 모형 최소 제곱을 통해 여러 방법으로 적합 할 수 있습니다 (최대 가능성과 동일한 매개 변수 추정값 및 거의 동일한 표준 오류를 제공함). 반복적으로 가중 된 최소 제곱 , 다양한 다른 형태의 " 강한 최소 제곱 "등. 피팅 선택은 종종 편의성, 편의성 ( 예 : 소프트웨어의 가용성), 친숙 함, 습관 또는 관습 에 근거 하지만, 최소한 몇 가지 생각이 있어야합니다. 오류 용어 의 가정 된 분포에 적합한 것에 대해ϵ i와이= β0+ β1엑스+ ϵϵ나는문제에 대한 손실 기능 은 합리적 일 수 있으며 추가 정보 (예 : 매개 변수에 대한 사전 분배) 를 이용할 가능성이있을 수 있습니다 .