사람들은 종종 어떤 사건이 일어날 확률이 50-60 %라고 말합니다. 때로는 사람들이 확률 할당에 대해 명시적인 오차 막대를 표시하는 것을 볼 수 있습니다. 이 진술들은 어떤 의미를 가지고 있거나 본질적으로 알 수없는 무언가를 위해 특정한 숫자를 선택하는 불편한 언어 적 문제 일까?
사람들은 종종 어떤 사건이 일어날 확률이 50-60 %라고 말합니다. 때로는 사람들이 확률 할당에 대해 명시적인 오차 막대를 표시하는 것을 볼 수 있습니다. 이 진술들은 어떤 의미를 가지고 있거나 본질적으로 알 수없는 무언가를 위해 특정한 숫자를 선택하는 불편한 언어 적 문제 일까?
답변:
얘기한다면 그것은 이해가되지 것입니다 알려진 공정 동전으로 예를 들면, 확률 던지는 헤드의 확률이 정의에 의해 0.5입니다. 그러나 교과서 예제에 대해 이야기하지 않는 한 정확한 확률은 알려져 있지 않으며 대략적으로 알 수 있습니다.
다른 이야기는 데이터에서 확률 을 추정 할 때입니다 . 예를 들어 구매 한 12563 개의 티켓 중에서 13 개의 당첨 티켓이 관찰되었으므로이 데이터 에서 확률은 13/12563 일 것으로 추정됩니다. 이것은 샘플에서 추정 한 것이므로 다른 샘플을 사용하면 다른 값을 볼 수 있기 때문에 불확실합니다. 불확실성 추정치는 확률에 관한 것이 아니라 추정치에 대한 것입니다.
다른 예는 확률이 고정되어 있지 않지만 다른 요인에 따라 달라지는 경우입니다. 자동차 사고로 사망 할 가능성에 대해 이야기하고 있다고 가정 해 봅시다. "글로벌"확률, 자동차 사고를 직간접 적으로 초래하는 모든 요소에 대해 소외되는 단일 값을 고려할 수 있습니다. 반면에, 위험 요소가 주어지면 모집단마다 확률이 어떻게 다른지 고려할 수 있습니다.
확률 자체가 임의의 변수 로 간주되는 더 많은 예제를 찾을 수 있으므로 수정하는 대신 다양합니다.
관련 캡션과 함께 :
... 효과 크기 1.68 (95 % CI : 1.56 (95 % CI : 1.52 (95 % CI : 1.504) (95 % CI : 1.494) (95 % CI : 1.488 (95 % CI : 1.485 (95 % CI : 1.482)) (95 % CI : 1.481 (95 % CI : 1.4799) (95 % CI : 1.4791 (95 % CI : 1.4784 ...)
나는 두 가지 해석을 알고있다. 첫 번째는 Tim이 말한 것입니다. 우리는 Y 시행에서 성공 을 관찰 했습니다. 따라서 시행이 iid라고 생각되면 몇 가지 오차 막대 (예 : 차수 1 / √)를 사용 하여 X / Y 에서의 공정 확률을 추정 할 수 있습니다. .
두 번째는 "고차 확률"또는 생성 프로세스에 대한 불확실성을 포함합니다. 예를 들어, 나는 크래프터 도박꾼이 제조 한 손에 동전을 가지고 있는데, 그 확률은 확률로 60 % 머리 동전을 만들고 확률로 40 % 머리 동전을 만들었습니다. 가장 좋은 추측은 50 % 확률로 동전이 나오지만 큰 오차 막대가 있다는 것입니다. "진정한"확률은 40 % 또는 60 %입니다.
다시 말해, 실험을 10 억 번 실행하고 의 성공률 (실제로 제한적인 비율)을 취하는 것을 상상할 수 있습니다 . 적어도 베이지안 관점에서 볼 때, 그 숫자 주위에 95 % 신뢰 구간을주는 것이 합리적입니다. 위의 예에서 현재 지식이 주어지면 이것은 입니다. 진짜 동전을 위해, 어쩌면 그것은이다 또는 뭔가. 자세한 내용은 다음을 참조하십시오.
더 높은 순서의 확률이 필요합니까? 그렇다면 그 의미는 무엇입니까? 유대 진주. UAI 1987. https://arxiv.org/abs/1304.2716
모든 측정 값이 불확실합니다.
따라서 확률 측정도 확실하지 않습니다.
확률 측정에 대한이 불확실성은 불확실성 막대로 시각적으로 표현 될 수 있습니다. 불확실성 막대는 종종 오류 막대라고도합니다. 이것은 오차가 아닌 불확실성을 나타 내기 때문에 부정확하거나 잘못 오도합니다 (오류는 측정과 미지의 진실의 차이이므로 오차는 알 수 없습니다. 불확도는 측정).
관련 주제는 메타 불확실성 입니다. 불확실성은 사후 확률 분포 함수의 폭을 기술하고, 유형 A 불확실성 (반복 된 측정에 의해 추정 된 불확실성)의 경우, 불확실성에 대한 불확실성이 불가피하다. 계측 학자들은 도량형 관행이이 경우에 불확실성을 확대해야한다고 말했다 (IIRC, 불확실성이 N 반복 측정의 표준 편차로 추정되는 경우, 결과 표준 편차에 N을 곱해야 함)본질적으로 메타 불확실성 인 N - 2 ).
확률에 대한 오차 막대는 어떻게 발생할 수 있습니까? 할당 할 수 있다고 가정합니다 . 경우 의미 , 다음 과
따라서 확률에 오차 막대를 추가하는 것은 확률 매개 변수에 불확실성을 추가하는 것과 유사하므로 확률을 수정할 수는 있지만 불확실 할 수는 없습니다.
확률 확률을 원하는 경우가 종종 있습니다. 예를 들어 식품 안전 분야에서 일하고 보툴리눔 포자가 식품 준비 단계 (예 : 요리) 및 배양 시간 / 온도 (cf 종이). 그런 다음 식품 생산자는이 모델을 사용하여 안전한 "사용 기한"날짜를 설정하여 보툴리누스 중독의 소비자 위험이 적절하게 작을 수 있습니다. 그러나이 모델은 유한 훈련 샘플에 적합하므로 발아 확률이 0.001 미만인 사용 날짜를 선택하는 대신 (모델링 가정을 적용한) 더 빠른 날짜를 선택할 수 있습니다. 발아 확률이 0.001보다 작다는 것을 95 % 확신 할 수 있습니다. 이것은 베이지안 환경에서 할 수있는 자연스러운 일인 것 같습니다.
TL; DR - 일회성 추측 특정 추측 해 행은 하나의 확률을 저감 할 수있다. 그러나 이것은 사소한 경우입니다. 확률 구조는 단지 단일 확률 이상의 문맥 상 관련성이있을 때마다 의미가 있습니다.
헤드에 임의의 동전이 착륙 할 확률은 50 %입니다.
그것이 공정한 동전인지 아닌지는 중요하지 않습니다. 적어도 나에게는 그렇지 않습니다. 코인은 지식이 풍부한 관찰자가 더 많은 정보를 바탕으로 예측할 수있는 편견을 가지고 있지만 50 % 확률을 추측해야합니다.
그래서 같은 것입니다.
완벽하게 공정한 코인의 특별한 경우를 제외하고, 두 머리 또는 꼬리를 얻는 확률은 항상 각 하나를 얻는 것보다 큽니다. 따라서 확률 자체가 불확실성을 포착한다고 가정하면 테이블을 줄이면 예측이 확장되지 않을 수 있습니다.
그리고 내가 말하려고하는 것은 대략 다음과 같습니다.
사람들은 종종 어떤 사건이 일어날 확률이 50-60 %라고 말합니다.
그들과 함께 앉아서 모든 데이터, 모델 등을 해결했다면 더 나은 수를 생성하거나 이상적으로는 더 강력하게 예측 능력을 포착 할 수있는 더 나은 모델을 생성 할 수 있습니다.
나는 오류 막대 만 중요 하다고 주장 하지만 주어진 예에서 모든 것은 거의 의미가 없습니다.
이 예는 어느 정도의 확실성의 상한과 하한이 확률 범위 인 신뢰 구간으로 해석하기에 적합합니다. 이 제안 된 답변은 그 해석을 다룰 것입니다. 다수 출처-https: //www.amazon.com/How-Measure-Anything-Intangibles-Business-ebook/dp/B00INUYS2U
예를 들어 주어진 신뢰 수준에 대한 답은 60 %를 넘지 않을 것이며 50 %를 넘지 않을 것입니다. 이것은 "binning"과 유사한 일련의 숫자로 매우 편리합니다. 55 %의 스왑이 +/- 5 % 범위로 스왑됩니다. 친숙한 숫자는 즉시 의심됩니다.
신뢰 구간에 도달하는 한 가지 방법은 선택한 신뢰 수준 (90 %라고 가정)을 결정하는 것입니다. 추정값보다 낮거나 높을 수 있지만 확률은 10 %입니다. "올바른"대답은 우리의 간격을 벗어난 것입니다. 따라서 우리는 "적절한 대답이이 상한보다 1/20의 확률 만있을 것"과 같은 하한을 추정하고 하한에 대해서도 비슷합니다. 이것은 하나의 측정 형태이거나 다른 형태의 측정 인 "보정 된 추정"을 통해 수행 될 수 있습니다.
어쨌든, 요점은 A) 불확실성과 관련된 불확실성이 있음을 처음부터 인정하고, B) 물건에 손을 던지거나, 엉망이라고 부르고, 단순히 위와 아래 5 %를 촉구하지 않는 것입니다. 장점은 선택한 정도에 엄격한 접근 방식 이 여전히 수학적으로 관련있는 결과를 수학적으로 표현할 수있는 정도까지 산출 할 수 있다는 것입니다. "이 두 범위 사이에 정답이있을 확률은 90 %입니다 ..." 제대로 구성된 신뢰 구간 (CI)이며 추가 계산에 사용할 수 있습니다.
더구나, 신뢰를 보장함으로써 예측과 결과를 비교하고 추정 방법을 개선하기 위해 찾은 것에 따라 행동함으로써 추정에 도달하는 데 사용 된 방법을 교정 할 수 있습니다. 완벽하게 할 수있는 것은 없지만 많은 것을 90 % 효과적으로 만들 수 있습니다.
90 % CI는 OP에 제공된 예가 필드의 10 %를 포함하고 90 %를 생략한다는 사실과 아무 관련이 없습니다. 보잉 747-100
의 날개 길이 는 90 % CI입니까? 글쎄, 나는 그것이 300 피트를 넘지 않는다고 95 % 확신하고, 200 피트 이상을 똑같이 확신합니다. 그래서 머리 꼭대기에서 90의 CI를 200으로 줄 것입니다. -235 피트
"중앙"추정치는 없습니다. CI는 추측과 퍼지 요인으로 구성되지 않습니다. 이것이 바로 오차 막대가 주어진 추정치보다 더 중요하다고 말하는 이유입니다.
즉, 간격 추정치 (위의 모든 것)는 올바르게 계산 된 오류 가있는 점 추정치보다 반드시 낫지는 않습니다 (이 시점에서 내 기억을 초월합니다-자주 잘못 수행 된 것만 기억합니다). 나는 단지 많은 수의 추정이 범위로 표현된다고 말하고 있습니다. 둥근 숫자 가있는 대부분의 범위는 간격 또는 포인트 + 오류 추정치가 아니라 포인트 + 퍼지입니다.
하나 개의 적절한 사용 포인트 + 오류 :
"기계는 컵에 액체를 채우고 컵의 내용물이 250g의 액체가되도록 조정해야합니다. 기계가 모든 컵을 정확히 250.0g으로 채울 수 없기 때문에 개별 컵에 추가 된 내용은 약간의 변화를 보여줍니다. 이 변동은 표준 편차 σ가 2.5g 인 원하는 평균 250g 주위에 정규 분포를 따르는 것으로 가정합니다. 기계가 적절히 보정되었는지 확인하려면 n = 25의 표본 액체 컵을 무작위로 선택하고 컵을 칭량합니다. 측정 된 액체 덩어리의 질량은 X1, ..., X25, X의 무작위 샘플입니다. "
요점 :이 예에서는 평균과 오차가 모두 추정 / 측정되지 않고 지정 / 가정됩니다.