ML 추정기는 데이터 세트에서 발생할 가능성이 가장 높은 모수 값을 산출합니다.
가정하면 ML 추정기는 데이터 세트를 생성 할 가능성이 가장 큰 모수의 값입니다.
"매개 변수에 대한 가장 가능성있는 값이 잘못된 값에 대한 편향으로 매개 변수의 실제 값을 어떻게 예측할 수 있습니까?"라는 관점에서 편향된 ML 추정값을 직관적으로 이해할 수 없습니다.
바이어스는 샘플링 분포에 대한 기대치입니다. "데이터를 생성 할 가능성이 높다"는 샘플링 분포에 대한 기대가 아닙니다. 그들은 왜 함께 갈 것으로 예상됩니까?
그들이 반드시 상응하는 것은 아니라는 것이 놀라운 근거는 무엇입니까?
간단한 MLE 사례를 고려하고 해당 사례에서 차이점이 어떻게 발생하는지 숙고하십시오.
예를 들어, 의 유니폼에 대한 관찰을 고려하십시오 . 가장 큰 관측치는 (필수적으로) 매개 변수보다 크지 않으므로 매개 변수는 최소한 가장 큰 관측치만큼 큰 값만 취할 수 있습니다.(0,θ)
의 가능성을 고려할 때 , θ 가 가장 큰 관측치에 가까울수록 (확실히) 커집니다 . 따라서 가장 큰 관측 에서 최대화 됩니다 . 그것은 당신이 얻은 샘플을 얻을 확률을 최대화하는 θ 의 추정치입니다 .θθθ
그러나 반면에 가장 큰 관측 값은 (확률 1) 실제 값보다 작기 때문에 편향되어야합니다 . 샘플 자체에 의해 아직 배제되지 않은 θ의 다른 추정값은 샘플보다 더 커야하며, (이 경우에는 명백하게) 샘플을 생성 할 가능성이 적어야합니다.θθ
에서 가장 큰 관측치의 기대 값 은 n입니다.U(0,θ) , 그것이 unbias에 일반적인 방법의 추정으로 취할 수 있도록θ: θ =N+1nn+1θ, 여기서X(n)은 가장 큰 관측치입니다.θ^=n+1nX(n)X(n)
이것은 MLE의 오른쪽에 있으므로 가능성이 낮습니다.