이것은 오래된 통계를 검토하는 동안의 이상한 생각이며 어떤 이유로 든 대답을 생각할 수없는 것 같습니다.
연속 PDF는 주어진 범위 내에서 관찰 값의 밀도를 알려줍니다. 즉, 예를 들어, 이면, 실현이 와 사이에있을 확률 은 간단히 여기서 는 표준 법선의 밀도입니다.
우리는 매개 변수의 MLE 추정을하고 생각할 때, 말할 , 우리는 말의 공동 밀도 쓰기 , 확률 변수 로그 우도 wrt를 분화하고 , 0으로 설정하고 풉니 다 . 종종 주어진 해석은 "데이터가 주어졌으며,이 파라미터는이 밀도 기능을 가장 그럴듯하게 만든다"고한다.
나를 괴롭히는 부분은 이것입니다. 우리는 rv 의 밀도를 가지고 있으며 , 샘플과 같이 특정 실현을 얻을 확률은 정확히 0입니다. 데이터가 주어지면 관절 밀도를 최대화하는 것이 왜 합리적입니까? 다시 실제 샘플을 관찰 할 확률은 정확히 0)입니까?
내가 올릴 수있는 유일한 합리화는 우리가 관찰 한 샘플 주변 에서 PDF를 가능한 한 최고점으로 하여 지역의 적분 (따라서이 지역에서 물건을 관찰 할 확률)을 높이고 자한다는 것 입니다.