student-t 오류가있는 회귀는 쓸모 없습니까?

편집을 참조하십시오.

꼬리가 굵은 데이터가있는 경우 student-t 오류로 회귀를 수행하는 것은 직관적 인 방법으로 보입니다. 이 가능성을 탐구하는 동안 나는이 논문에 부딪쳤다.

Breusch, TS, Robertson, JC, & Welsh, AH (1997 년 11 월 1 일). 황제의 새로운 옷 : 다변량 회귀 모델에 대한 비판. Statistica Neerlandica, 51, 3.) ( link , pdf )

어느 쪽의 의미에서 척도 모수와 자유도 모수는 서로에 대해 식별 할 수 없으며 t 오류로 회귀를 수행하면 표준 선형 회귀가 수행하는 것 이상으로 아무것도 할 수 없다고 주장합니다.

Zellner (1976)는 데이터 벡터 (또는 오류 벡터)가 다변량 스튜던트 t 분포로부터의 실현으로 표현되는 회귀 모델을 제안했습니다. 이 모델은 일반적인 가우스 가정을 확장하여 더 넓은 꼬리 오차 분포를 허용하는 것 같습니다. 문헌의 많은 결과는 가우시안 모델에 대한 표준 추론 절차가 더 넓은 분포 가정 하에서 적절하게 유지되어 표준 방법의 견고성에 대한 주장을 초래한다는 것을 나타냅니다. 우리는 비록 수학적으로 두 모델이 다르지만 통계적 추론을 위해 구별 할 수 없음을 보여줍니다. 다변량 t 모델의 경험적 의미는 가우시안 모델의 그것과 정확히 동일합니다. 따라서 데이터의 광범위한 분포 표현에 대한 제안은 의심스럽고 견고성에 대한 주장은 오해의 소지가 있습니다. 이러한 결론은 잦은 관점과 베이지안 관점에서 모두 도달합니다.

이것은 나를 놀라게한다.

나는 그들의 논증을 잘 평가할 수있는 수학적 정교함이 없기 때문에 몇 가지 질문이 있습니다. t- 오류로 회귀를하는 것이 일반적으로 유용하지 않다는 것이 사실입니까? 그것들이 때때로 유용하다면, 나는 논문을 잘못 이해 했습니까? 그들이 유용하지 않다면, 이것은 잘 알려진 사실입니까? 꼬리가 두꺼운 데이터를 설명하는 다른 방법이 있습니까?

편집 : 단락 3과 섹션 4를 자세히 읽으면 아래의 논문이 학생 t 회귀로 생각한 것에 대해 이야기하지 않는 것처럼 보입니다 (오류는 독립적 인 일 변량 분포입니다). 대신 단일 분포에서 오류가 발생하며 독립적이지 않습니다. 내가 올바르게 이해한다면, 독립의 부족은 왜 당신이 독립적으로 규모와 자유도를 추정 할 수 없는지를 설명하는 것입니다.

이 논문은 읽지 않기 위해 논문 목록을 제공한다고 생각합니다.

— 존 살 바티에
소스

보관 용지를 통해 용지를 배포 할 수 있는지 확인하십시오. 더 나은 이중 확인.

— Toby El Tejedor

라플라스 분포는 두꺼운 꼬리를 어느 정도 치료할 수있는 기회를 제공한다고 생각합니다.

— Toby El Tejedor

편집 내용이 정확합니다. 논문에 제시된 결과는 다변량 t 오차에만 적용됩니다. 독립적 인 t 오류를 사용하는 경우 안전합니다.

나는 그 종이가 잘 알려져 있다고 생각하지 않지만 그것이 맞다고 생각합니다.

통계 문헌은 많은 경우에 매개 변수화, 일대일 변환 또는 때로는 쓸모없는 "일반화 (generalization)"로 가득차있다. 문제의 모델의 일부 특성을 일반화하는 데 크게 기여하지 않기 때문이다.