다단계 요인이있는 모형에 적합하려면 왜 R이 오래 걸립니까?


12

여러 수준의 요인이있는 모델에 적합하며 해당 모델에 적합하려면 R이 실제로 오랜 시간이 걸립니다. 왜 이런거야?

예를 들어, 플레이어의 급여를 예측하기 위해 회귀 분석을 적용하고 모든 플레이어의 각 국적에 대한 요인 예측 변수를 포함시키는 경우 플레이어의 급여에 대한 모델을 플레이어의 연속 예측 변수와 맞추는 것보다 시간이 오래 걸립니다. 높이.


5
요인이 하나의 변수 (데이터 프레임의 한 열, 모델 사양의 한 항목 등) 인 것처럼 보이지만 실제로는 여러 개의 예측 변수로 취급됩니다. 따라서 모형은 단일 (연속) 예측 변수가있는 모형보다 훨씬 더 복잡합니다.
갈라

답변:


13

R은 일반적입니다. 대부분의 통계 패키지와 마찬가지로 회귀에 QR 분해를 사용합니다.

고정 들어 , 여기서 바로 분해 자체를 효과적으로 계산에 차 함수 (4) 주위로 예측기의 수 것 곱셈 연산 배가 시간 -.<<

따라서 (선형 회귀)에서 으로 이동하면 600 배 더 긴 영역 (실제로는 여러 가지 이유로 다소 적을 것)의 영역에서 무언가를 취할 것으로 기대합니다.=2=50

따라서 예측 변수를 많이 추가하면 대기 시간이 훨씬 길어집니다.


7

이는 수준을 갖는 요인으로 R은 지표 변수를 생성 하기 때문입니다 . 따라서 국적 이 있다고 가정 하고, 연속 선형으로 처리하지 않는 경우 간단한 선형 회귀 분석과 비교하여 예측 변수가 있는 다중 회귀 모형을 적합 하게 만듭니다. 아마도 대륙을 구성하는 새로운 요소 나 국적을 더 거칠게 묶는 새로운 요소를 만들어서 속도를 높이고보다 교묘 한 모델을 만들 수도 있습니다.케이케이1케이=5049

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.