확률의 오차 막대에 의미가 있습니까?


25

사람들은 종종 어떤 사건이 일어날 확률이 50-60 %라고 말합니다. 때로는 사람들이 확률 할당에 대해 명시적인 오차 막대를 표시하는 것을 볼 수 있습니다. 이 진술들은 어떤 의미를 가지고 있거나 본질적으로 알 수없는 무언가를 위해 특정한 숫자를 선택하는 불편한 언어 적 문제 일까?


1
계산 학습 이론의 아마도 대략적인 틀은 그렇게하지 않습니다. 일반적으로 확률 ? 그것이 무의미한 개념이라면, 나는 (매우 영리한) CoLT 사람들이 그것을 발견하지 못했을 것입니다! 1δ
Dikran Marsupial

5
@DikranMarsupial PAC 학습의 오류는 확률 자체 (이 질문에서 묻는 것)가 아니라 데이터에 있습니다. 즉, 확률 로 답이 실제 값 의 거리 내에 있음을 증명할 수 있다면 알고리즘의 결과를 Probably approx Correct라고 부릅니다 . 1δε
이산 도마뱀

@Discretelizard이지만 분류 설정에서 오류율 (오류 확률)에 묶이지 않습니까? CoLT를 본 후 오랜 시간!
Dikran Marsupial

1
@DikranMarsupial PAC- 러닝의 일반 설정에서 '대략적인'부분은 '우도'가 아니라 오류의 '크기'를 측정합니다. PAC 경계에 대한 동기는 예를 들어 예상 위험보다 더 세밀한 분석을 얻는 것입니다. PAC가 이해하기 위해서는 클래스 사이에 정의 된 '거리'(또는 손실 함수)가 있어야하지만 분류 설정에서 이러한 변경 사항은 생각하지 않습니다. (이진 분류의 더 특별한 경우에는 오류를 만드는 한 가지 방법 만 있으므로 대략적인 부분은이 경우에는 의미가 없습니다.)
이산 도마뱀

답변:


36

얘기한다면 그것은 이해가되지 것입니다 알려진 공정 동전으로 예를 들면, 확률 던지는 헤드의 확률이 정의에 의해 0.5입니다. 그러나 교과서 예제에 대해 이야기하지 않는 한 정확한 확률은 알려져 있지 않으며 대략적으로 알 수 있습니다.

다른 이야기는 데이터에서 확률 을 추정 할 때입니다 . 예를 들어 구매 한 12563 개의 티켓 중에서 13 개의 당첨 티켓이 관찰되었으므로이 데이터 에서 확률은 13/12563 일 것으로 추정됩니다. 이것은 샘플에서 추정 한 것이므로 다른 샘플을 사용하면 다른 값을 볼 수 있기 때문에 불확실합니다. 불확실성 추정치는 확률에 관한 것이 아니라 추정치에 대한 것입니다.

다른 예는 확률이 고정되어 있지 않지만 다른 요인에 따라 달라지는 경우입니다. 자동차 사고로 사망 할 가능성에 대해 이야기하고 있다고 가정 해 봅시다. "글로벌"확률, 자동차 사고를 직간접 적으로 초래하는 모든 요소에 대해 소외되는 단일 값을 고려할 수 있습니다. 반면에, 위험 요소가 주어지면 모집단마다 확률이 어떻게 다른지 고려할 수 있습니다.

확률 자체가 임의의 변수 로 간주되는 더 많은 예제를 찾을 수 있으므로 수정하는 대신 다양합니다.


1
확률 회귀 계산이 로지스틱 회귀와 같은 것을 통해 수행 된 경우, 이러한 "오류 막대"가 예측 구간을 가정한다고 가정하는 것이 자연스럽지 않습니까? (저는 당신이 가장 먼저 제기 한 첫 번째 요점을 분명히 설명하고 있습니다 (+1))
usεr11852는

1
실제 경우에 따라 @ usεr11852 신뢰 구간, 예측 구간, 고밀도 영역 등. 우리는 많은 시나리오에서 "다양한"확률을 갖고 있으며 다양한 방법으로 다양하기 때문에 대답을 매우 광범위하게 만들었습니다. 또한 시나리오마다 다르게 해석 할 수 있습니다.

1
"알려진"확률조차도 매우 작은 오차 막대의 속기 일 수 있습니다. 아마도 동전 플립이 아마도 50.0000 %-49.99999 %이고 50.00000 %를 배제하는 작은 오차 막대를 충분히 얻을 수있을 것입니다. 비대칭 동전의 경우에도 확률이 정확해야 함을 암시하는 물리 법칙은 없지만 오류 막대는 너무 작아서 관리 할 수 ​​없습니다.
핵 왕

5
@NuclearWang 이것은 "공정 주화"라는 문구의 OP 사용에 의해 설명됩니다. 정의에 따르면 공정 동전의 P (HEADS)는 0.5입니다. 공정한 동전은 수학적 구성입니다. 이 점을 강조하기 위해 "물리 법칙"을 "정의"로 바꾸는 편집을 제안합니다.
De Novo는 GoFundMonica

2
@DeNovo는 실제 동전 stat.columbia.edu/~gelman/research/published/diceRev2.pdf 에도 동일하게 적용 되지만,이 토론을 시작하지 말라고 "공정한"이라고 말했습니다
Tim

23

xkcd에서 가장 관련성 높은 그림 :

여기에 이미지 설명을 입력하십시오

관련 캡션과 함께 :

... 효과 크기 1.68 (95 % CI : 1.56 (95 % CI : 1.52 (95 % CI : 1.504) (95 % CI : 1.494) (95 % CI : 1.488 (95 % CI : 1.485 (95 % CI : 1.482)) (95 % CI : 1.481 (95 % CI : 1.4799) (95 % CI : 1.4791 (95 % CI : 1.4784 ...)


이것은 확률에 대한 오차 막대가 중복됨을 의미합니까?
BalinKingOfMoria

12
놀랍게도, 이것은 오차 막대의 정밀도가 불확실하고 불확실성의 평가 자체가 불확실하다는 것을 의미합니다.
시안

7
그렇기 때문에 나는 그림이 적절하다고 생각하고 통계 오류를 평가하는 근본적인 어려움 (그리고 아름다운 도전)과 깊은 관련이 있다고 생각합니다.
시안

14
이 그림은 불확실성 자체가 확률 분포의 폭의 척도이기 때문에 확률에 대한 불확실성과 관련이있을 수있는 메타 불확실성을 보여 주지만, 귀하의 게시물은 어떤 식 으로든 설명하지 않습니다. 실제로 XKCD 만화는 오류 전파와 관련이 있다고 제안하지만 (거짓) 문제는 아닙니다.
gerrit

6

나는 두 가지 해석을 알고있다. 첫 번째는 Tim이 말한 것입니다. 우리는 Y 시행에서 X 성공 을 관찰 했습니다. 따라서 시행이 iid라고 생각되면 몇 가지 오차 막대 (예 : 차수 1 / √)를 사용 하여 X / Y 에서의 공정 확률을 추정 할 수 있습니다.YX/Y1/Y .

두 번째는 "고차 확률"또는 생성 프로세스에 대한 불확실성을 포함합니다. 예를 들어, 나는 크래프터 도박꾼이 제조 한 손에 동전을 가지고 있는데, 그 확률은 0.5 확률로 60 % 머리 동전을 만들고 0.5 확률로 40 % 머리 동전을 만들었습니다. 가장 좋은 추측은 50 % 확률로 동전이 나오지만 큰 오차 막대가 있다는 것입니다. "진정한"확률은 40 % 또는 60 %입니다.

다시 말해, 실험을 10 억 번 실행하고 X/Y 의 성공률 (실제로 제한적인 비율)을 취하는 것을 상상할 수 있습니다 . 적어도 베이지안 관점에서 볼 때, 그 숫자 주위에 95 % 신뢰 구간을주는 것이 합리적입니다. 위의 예에서 현재 지식이 주어지면 이것은 [0.4,0.6] 입니다. 진짜 동전을 위해, 어쩌면 그것은이다 [0.47,0.53] 또는 뭔가. 자세한 내용은 다음을 참조하십시오.

더 높은 순서의 확률이 필요합니까? 그렇다면 그 의미는 무엇입니까? 유대 진주. UAI 1987. https://arxiv.org/abs/1304.2716


4

모든 측정 값이 불확실합니다.

따라서 확률 측정도 확실하지 않습니다.

확률 측정에 대한이 불확실성은 불확실성 막대로 시각적으로 표현 될 수 있습니다. 불확실성 막대는 종종 오류 막대라고도합니다. 이것은 오차가 아닌 불확실성을 나타 내기 때문에 부정확하거나 잘못 오도합니다 (오류는 측정과 미지의 진실의 차이이므로 오차는 알 수 없습니다. 불확도는 측정).

관련 주제는 메타 불확실성 입니다. 불확실성은 사후 확률 분포 함수의 폭을 기술하고, 유형 A 불확실성 (반복 된 측정에 의해 추정 된 불확실성)의 경우, 불확실성에 대한 불확실성이 불가피하다. 계측 학자들은 도량형 관행이이 경우에 불확실성을 확대해야한다고 말했다 (IIRC, 불확실성이 N 반복 측정의 표준 편차로 추정되는 경우, 결과 표준 편차에 N을 곱해야 함)NN2본질적으로 메타 불확실성 인 N - 2 ).


3

확률에 대한 오차 막대는 어떻게 발생할 수 있습니까? prob(A|Θ=θ,I) 할당 할 수 있다고 가정합니다 . 경우 I 의미 Θ=θ0 , 다음 prob(Θ=θ|I)=δθθ0

prob(A|I)=θprob(A|Θ=θ,I)δθθ0=prob(A|Θ=θ0,I)

ΘIprob(Θ=θ|I)prob(A|I)AΘ=θΘA

prob(A,Θ=θ|I)=prob(A|Θ=θ,I)prob(Θ=θ|I)prob(A|I)=θprob(A|Θ=θ,I)prob(Θ=θ|I)

따라서 확률에 오차 막대를 추가하는 것은 확률 매개 변수에 불확실성을 추가하는 것과 유사하므로 확률을 수정할 수는 있지만 불확실 할 수는 없습니다.


1

확률 확률을 원하는 경우가 종종 있습니다. 예를 들어 식품 안전 분야에서 일하고 보툴리눔 포자가 식품 준비 단계 (예 : 요리) 및 배양 시간 / 온도 (cf 종이). 그런 다음 식품 생산자는이 모델을 사용하여 안전한 "사용 기한"날짜를 설정하여 보툴리누스 중독의 소비자 위험이 적절하게 작을 수 있습니다. 그러나이 모델은 유한 훈련 샘플에 적합하므로 발아 확률이 0.001 미만인 사용 날짜를 선택하는 대신 (모델링 가정을 적용한) 더 빠른 날짜를 선택할 수 있습니다. 발아 확률이 0.001보다 작다는 것을 95 % 확신 할 수 있습니다. 이것은 베이지안 환경에서 할 수있는 자연스러운 일인 것 같습니다.


0

TL; DR - 일회성 추측 특정 추측 해 행은 하나의 확률을 저감 할 수있다. 그러나 이것은 사소한 경우입니다. 확률 구조는 단지 단일 확률 이상의 문맥 상 관련성이있을 때마다 의미가 있습니다.


헤드에 임의의 동전이 착륙 할 확률은 50 %입니다.

그것이 공정한 동전인지 아닌지는 중요하지 않습니다. 적어도 나에게는 그렇지 않습니다. 코인은 지식이 풍부한 관찰자가 더 많은 정보를 바탕으로 예측할 수있는 편견을 가지고 있지만 50 % 확률을 추측해야합니다.

HeadsTails50%50%.
First flipSecondflipHeadsTailsHeads25%25%Tails25%25%,
Same sidetwiceHeadsand Tails50%50%.

PHeads,

HeadsTailsPHeads1PHeads.
First flipSecondflipHeadsTailsHeadsPHeads2PHeads(1PHeads)TailsPHeads(1PHeads)(1PHeads)2,
Same sidetwiceHeadsand Tails12PHeads(1PHeads)2PHeads(1PHeads).
PHeads,50%,

그래서 같은 것입니다.

완벽하게 공정한 코인의 특별한 경우를 제외하고, 두 머리 또는 꼬리를 얻는 확률은 항상 각 하나를 얻는 것보다 큽니다. 따라서 확률 자체가 불확실성을 포착한다고 가정하면 테이블을 줄이면 예측이 확장되지 않을 수 있습니다.

PHeads

50%",probably about 50%".

그리고 내가 말하려고하는 것은 대략 다음과 같습니다.

50%.


사람들은 종종 어떤 사건이 일어날 확률이 50-60 %라고 말합니다.

그들과 함께 앉아서 모든 데이터, 모델 등을 해결했다면 더 나은 수를 생성하거나 이상적으로는 더 강력하게 예측 능력을 포착 할 수있는 더 나은 모델을 생성 할 수 있습니다.

PHeads=50%


0

나는 오류 막대 중요 하다고 주장 하지만 주어진 예에서 모든 것은 거의 의미가 없습니다.
이 예는 어느 정도의 확실성의 상한과 하한이 확률 범위 인 신뢰 구간으로 해석하기에 적합합니다. 이 제안 된 답변은 그 해석을 다룰 것입니다. 다수 출처-https: //www.amazon.com/How-Measure-Anything-Intangibles-Business-ebook/dp/B00INUYS2U


예를 들어 주어진 신뢰 수준에 대한 답은 60 %를 넘지 않을 것이며 50 %를 넘지 않을 것입니다. 이것은 "binning"과 유사한 일련의 숫자로 매우 편리합니다. 55 %의 스왑이 +/- 5 % 범위로 스왑됩니다. 친숙한 숫자는 즉시 의심됩니다.
신뢰 구간에 도달하는 한 가지 방법은 선택한 신뢰 수준 (90 %라고 가정)을 결정하는 것입니다. 추정값보다 낮거나 높을 수 있지만 확률은 10 %입니다. "올바른"대답은 우리의 간격을 벗어난 것입니다. 따라서 우리는 "적절한 대답이이 상한보다 1/20의 확률 만있을 것"과 같은 하한을 추정하고 하한에 대해서도 비슷합니다. 이것은 하나의 측정 형태이거나 다른 형태의 측정 인 "보정 된 추정"을 통해 수행 될 수 있습니다.
어쨌든, 요점은 A) 불확실성과 관련된 불확실성이 있음을 처음부터 인정하고, B) 물건에 손을 던지거나, 엉망이라고 부르고, 단순히 위와 아래 5 %를 촉구하지 않는 것입니다. 장점은 선택한 정도에 엄격한 접근 방식 이 여전히 수학적으로 관련있는 결과를 수학적으로 표현할 수있는 정도까지 산출 할 수 있다는 것입니다. "이 두 범위 사이에 정답이있을 확률은 90 %입니다 ..." 제대로 구성된 신뢰 구간 (CI)이며 추가 계산에 사용할 수 있습니다.
더구나, 신뢰를 보장함으로써 예측과 결과를 비교하고 추정 방법을 개선하기 위해 찾은 것에 따라 행동함으로써 추정에 도달하는 데 사용 된 방법을 교정 할 수 있습니다. 완벽하게 할 수있는 것은 없지만 많은 것을 90 % 효과적으로 만들 수 있습니다.
90 % CI는 OP에 제공된 예가 필드의 10 %를 포함하고 90 %를 생략한다는 사실과 아무 관련이 없습니다. 보잉 747-100
의 날개 길이 는 90 % CI입니까? 글쎄, 나는 그것이 300 피트를 넘지 않는다고 95 % 확신하고, 200 피트 이상을 똑같이 확신합니다. 그래서 머리 꼭대기에서 90의 CI를 200으로 줄 것입니다. -235 피트
"중앙"추정치는 없습니다. CI는 추측과 퍼지 요인으로 구성되지 않습니다. 이것이 바로 오차 막대가 주어진 추정치보다 더 중요하다고 말하는 이유입니다.


즉, 간격 추정치 (위의 모든 것)는 올바르게 계산 된 오류 가있는 점 추정치보다 반드시 낫지는 않습니다 (이 시점에서 내 기억을 초월합니다-자주 잘못 수행 된 것만 기억합니다). 나는 단지 많은 수의 추정이 범위로 표현된다고 말하고 있습니다. 둥근 숫자 가있는 대부분의 범위는 간격 또는 포인트 + 오류 추정치가 아니라 포인트 + 퍼지입니다.


하나 개의 적절한 사용 포인트 + 오류 :

"기계는 컵에 액체를 채우고 컵의 내용물이 250g의 액체가되도록 조정해야합니다. 기계가 모든 컵을 정확히 250.0g으로 채울 수 없기 때문에 개별 컵에 추가 된 내용은 약간의 변화를 보여줍니다. 이 변동은 표준 편차 σ가 2.5g 인 원하는 평균 250g 주위에 정규 분포를 따르는 것으로 가정합니다. 기계가 적절히 보정되었는지 확인하려면 n = 25의 표본 액체 컵을 무작위로 선택하고 컵을 칭량합니다. 측정 된 액체 덩어리의 질량은 X1, ..., X25, X의 무작위 샘플입니다. "

요점 :이 예에서는 평균과 오차가 모두 추정 / 측정되지 않고 지정 / 가정됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.