다음과 같은 형식의 데이터가 제공되었다고 가정합니다. ( y,엑스1,엑스2, ⋯ ,엑스엔) 과 ( y,엑스1,엑스2, ⋯ ,엑스n - 1). 우리는 예측의 임무가 주어진다와이 의 가치에 따라 엑스. 다음과 같은 두 가지 회귀를 추정합니다.
와이와이=에프1(엑스1, ⋯ ,엑스n - 1,엑스엔)=에프2(엑스1, ⋯ ,엑스n - 1)(1)(2)
우리는 또한 값을 예측하는 회귀를 추정합니다. 엑스엔 의 가치에 따라 (엑스1, ⋯ ,엑스n - 1), 그건:
엑스엔=에프삼(엑스1, ⋯ ,엑스n - 1)(삼)
이제 우리는 (엑스1, ⋯ ,엑스n - 1)그러면 두 가지 다른 방법으로 예측할 수 있습니다 와이:
와이와이=에프1(엑스1, ⋯ ,엑스n - 1,에프삼(엑스1, ⋯ ,엑스n - 1) )=에프2(엑스1, ⋯ ,엑스n - 1)(4)(5)
어느 쪽이 일반적으로 더 좋을까요?
첫 번째 방정식은 두 가지 데이터 포인트 형식의 정보를 활용하기 때문에 두 번째 방정식은 n - 1예측 변수 값. 통계 교육이 제한되어 있으므로 전문적인 조언을 구하고 싶습니다.
또한 일반적으로 정보가 불완전한 데이터에 가장 적합한 방법은 무엇입니까? 다시 말해, 값이 전혀없는 데이터에서 가장 많은 정보를 추출하는 방법엔 치수?