가정 독립적이며
또한 가정 파라미터 및 P = ( P 1 , ... , P는 N을 ) 충족
같은 공변량이 영향을 미치는 경우 및 페이지를 수 있도록 B = G , 왜 제로는 포아송 회귀 포아송 회귀 많은 매개 변수로 두 번 필요로 팽창 하는가?
가정 독립적이며
또한 가정 파라미터 및 P = ( P 1 , ... , P는 N을 ) 충족
같은 공변량이 영향을 미치는 경우 및 페이지를 수 있도록 B = G , 왜 제로는 포아송 회귀 포아송 회귀 많은 매개 변수로 두 번 필요로 팽창 하는가?
답변:
제로 팽창 된 포아송의 경우, 이면 β 와 λ는 모두 같은 길이, 즉 B 또는 G 의 열 수입니다 . 따라서 매개 변수의 수는 설계 행렬의 열 수의 두 배입니다. 즉 인터셉트 (및 더미 코딩이 필요한 모든 것을 포함)를 포함하는 설명 변수의 수의 두 배입니다.
직선형 포아송 회귀에서는 걱정할 벡터 가 없으며 λ 를 추정 할 필요가 없습니다 . 따라서 매개 변수의 수는 단지 β 의 길이, 즉 제로 팽창 된 경우의 매개 변수 수의 절반입니다.
이제 가 G 와 같은 특별한 이유 는 없지만 일반적으로 의미가 있습니다. 그러나 하나의 프로세스 G λ에 의해 이벤트가 발생할 확률이 생성되고 완전히 다른 프로세스 B β 가 0이 아닌 이벤트가 주어지면 얼마나 많은 이벤트가 발생 하는지를 나타내는 데이터 생성 프로세스를 상상할 수 있습니다. 예를 들어, 나는 역사 시험 점수를 기반으로 교실을 선택하여 관련없는 게임을 한 다음 점수 목표를 관찰합니다. 이 경우 B 는 G와 상당히 다를 수 있습니다 (히스토리 시험 점수를내는 것이 게임의 주행 성능과 다른 경우) 및 β 및 λ길이가 다를 수 있습니다. 는 B 보다 많은 열을 가질 수 있습니다 . 따라서이 경우 제로 팽창 된 포아송 모델은 단순한 포아송 모델보다 더 많은 매개 변수를 갖습니다.
일반적으로 라고 생각 합니다.