Wikipedia에서 인용 :
통계에서, 일관된 추정기 또는 무의식적으로 일관된 추정기는 추정기 (모수 의 계산을 계산하는 규칙)- 사용 된 데이터 포인트 수가 무한정 증가함에 따라 결과 추정치가 확률로 수렴되는 특성을 가짐 .θ ∗
이 문장을 정확하게 만들려면 를 추정하려는 실제 매개 변수의 값으로, 데이터의 함수로이 매개 변수를 추정하는 규칙으로하십시오. 그런 다음 추정기의 일관성 정의는 다음과 같이 표현 될 수 있습니다.
내 질문은 처음에는 피상적으로 보이지만 "일관성 / 일관성"이라는 단어가 추정기의 이러한 동작을 설명하는 데 사용 된 이유 는 무엇입니까?
내가 이것에 관심을 갖는 이유는, 직관적으로, 일관성이라는 단어는 다른 것을 의미하기 때문입니다. 예를 통해 그것이 무엇을 의미하는지 알려 드리겠습니다. "당신"이 지속적으로 "좋은"(일부 좋은 정의를 위해)이라고 말하면, 일관성이란 당신이 좋은 것을 증명 / 보여줄 기회가있을 때마다, 매번 당신이 좋다는 것을 실제로 증명한다는 것을 의미합니다. (또는 적어도 대부분).
견적의 일관성을 정의하기 위해 직관을 적용하겠습니다. "your"를 계산하는 함수 하고 "good"은 실제 추정치 에서 어느 정도 떨어져 있는지를 의미합니다 ( 규범의 의미 에서 좋은 이유는 아닙니다). 그러면 일관성에 대한 더 나은 정의는 다음과 같습니다. θ*L1
일관성에 대한 덜 유용한 정의 일지라도 일관성을 정의하는 방식으로 나에게 더 의미가 있습니다. 훈련 / 샘플 세트의 경우 추정기 던지기 때문에 좋은 일, 즉 나는 지속적으로 잘 할 것입니다. 나는 모든 n (아마도 불가능한)에 대해 약간 비현실적이라는 것을 알고 있지만 다음과 같이 말 함으로써이 정의를 해결할 수 있습니다.
즉, 충분히 큰 n의 경우 추정기는 실제 에서 (즉 , "진실"에서 넘지 않아야 함)보다 나쁘지 않습니다 . 은 최소한 필요한 직관을 포착하려고합니다. 어떤 것을 배우거나 추정하기위한 몇 가지 예가 있고, 일단 그 숫자에 도달하면, 우리가 그것을 정의하려는 방식에 일관성이 있다면 견적자는 대부분의 시간을 잘 할 것입니다).ϵ θ ∗
그러나 이전의 정의는 강력합니다. 어쩌면 우리 는 크기 의 대부분의 훈련 세트에 대해 에서 멀어 질 가능성이 (즉 , 모든 대해 이것을 요구 하지는 않지만 끝났습니다) 의 분포 또는 이와 유사한 것). 따라서 우리가 가지고있는 대부분의 샘플 / 트레이닝 세트에 대해서는 매우 드물게 오류가 발생합니다. n ≥ n 0 S n
어쨌든, 나의 질문은, "일관성"에 대한 이러한 제안 된 정의가 실제로 일관성의 "공식적인"정의와 동일하지만 동등성이 증명하기 어렵다는 것입니다. 증거를 알고 있다면 공유하십시오! 아니면 내 직감이 완전히 벗어 났으며 일반적으로 정의 된 방식으로 정의 일관성을 선택 해야하는 더 깊은 이유가 있습니까? ( "공식적인") 일관성이 왜 그렇게 정의되어 있습니까?
어떤 종류의 동등성에 대한 후보 증거에 대한 내 생각 중 일부는 일관성 개념과 허용되는 일관성 개념 사이의 유사성이 한계의 정의. 그러나 나는 그것을 수행하는 방법을 100 % 확신하지 못했으며 시도한 경우에도 일관성에 대한 공식적인 정의는 모든 잠재적 인 훈련 / 샘플 세트에 대해 이야기하는 것을 고려하지 않는 것 같습니다. 그것들이 동등하다고 생각하기 때문에 내가 제공 한 공식적인 정의가 불완전합니까 (즉, 우리가 할 수있는 데이터 세트 또는 샘플 세트를 생성 할 수있는 모든 다른 데이터 세트에 대해 이야기하지 않는 이유)?
마지막 생각 중 하나는, 우리가 제공하는 모든 정의는 우리가 이야기 할 확률 분포에 대한 정확한 wrt이어야한다는 것입니다 또는 입니다. 나는 그것이 보장 된 것이라도 고정 분포로 또는 보증 세트에 가능한 모든 분포로 wrt를 보장한다면, 후보도 정확해야한다고 생각합니다.P S의 N