간단한 예는 우리가 필수적인 것을 식별하는 데 도움이됩니다.
하자
와이= C+ γ엑스1+ ε
여기서 및 는 매개 변수이고 은 첫 번째 계측기 (또는 독립 변수)의 점수이며 은 바이어스되지 않은 iid 오류를 나타냅니다. 두 번째 기기의 점수가 첫 번째 기기의 점수와씨γ엑스1ε
엑스1= α X2+ β.
예를 들어, 두 번째 기기의 점수는 25에서 75 사이이며 첫 번째 점수는 0에서 100 사이이며 입니다. 의 분산 은 곱하기 의 분산입니다 . 그럼에도 불구하고 우리는 다시 쓸 수 있습니다엑스1= 2 X2− 50엑스1α2엑스2
Y=C+γ(αX2+β)=(C+βγ)+(γα)X2+ε=C′+γ′X2+ε.
모수는 변하고 독립 변수의 분산 은 변하지 만 모델의 예측 능력은 변하지 않습니다 .
일반적으로 과 의 관계는 비선형 일 수 있습니다. 이는 더 좋은 예측기이다 에 가까운 선형 관계를 갖는 의존한다 . 따라서이 문제는 ( 의 분산에 의해 반영된) 규모 중 하나가 아니라 기기 간의 관계와 예측에 사용되는 대상에 의해 결정되어야합니다. 이 아이디어는 회귀에서 독립 변수를 선택 하는 것에 대한 최근의 질문에서 탐구 된 것과 밀접한 관련이 있습니다.X 2 Y Y X iX1X2YYXi
완화 요소가있을 수 있습니다. 예를 들어, 과 가 이산 변수이고 둘 다 와 동일하게 관련되어있는 경우, 분산 이 더 큰 변수 는 (균일하게 분산되어있는 경우) 값을보다 세밀하게 구분하여 정밀도를 높일 수 있습니다. 예를 들어, 두 악기 모두 동일하게와 상관 관계가 1-5 리 커트 척도로 설문 조사, 경우, , 그리고에 대한 답변 모든 (2), (3)과 답변입니다 1 ~ 5 사이에 확산되어, 에 선호 될 수있다 이 기초.X 2 Y Y X 1 X 2 X 2X1X2YYX1X2X2