비행기 사고 집단은 얼마나 이상합니까?


15

원래 질문 (7/25/14) : 뉴스 매체에서 인용 한이 말이 의미가 있거나 최근의 비행기 사고의 부분을보다 잘 통계적으로 볼 수있는 방법이 있습니까?

그러나 Barnett은 Poisson 분포 이론에주의를 기울입니다. 이는 충돌 간의 짧은 간격이 실제로 긴 충돌보다 더 가능성이 있음을 의미합니다.

바넷은“연간 평균 1 건의 치명적인 사고가 발생한다고 주장했다. 이는 하루 중 충돌 사고가 365 일에 1 회 발생한다는 것을 의미한다. "8 월 1 일에 충돌이 발생한 경우 다음 날 8 월 2 일에 다음 충돌이 발생할 확률은 1/365입니다. 그러나 다음 충돌이 8 월 3 일에 발생할 가능성은 (364/365) x (1/365)입니다. 8 월 2 일에 충돌이없는 경우에만 다음 충돌이 8 월 3 일에 발생하기 때문입니다. "

바넷은“이것은 반 직관적 인 것처럼 보이지만 결론은 확률 법칙에 따라 끊임없이 뒤 따른다.

출처 : http://www.bbc.com/news/magazine-28481060

설명 (7/27/14) : (나에게) 반 직관적 인 것은 드문 사건이 시간이 가까워지는 경향이 있다는 것입니다. 직관적으로, 드문 사건은 제 시간에 가깝지 않을 것이라고 생각합니다. 누구든지 Poisson 분포를 가정하여 사건 사이의 이론적 또는 경험적 예상 시간 분포를 지적 할 수 있습니까? (즉, y 축이 빈도 또는 확률이고 x 축이 일, 주, 월 또는 년 등으로 그룹화 된 2 개의 연속 발생 사이의 시간 인 히스토그램입니다.) 감사합니다.

설명 (7/28/14) : 헤드 라인은 광범위한 사고보다 사고 클러스터가있을 가능성이 높다는 것을 의미합니다. 그것을 조작 할 수 있습니다. 군집이 3 건의 비행기 사고이고 단기간은 3 개월이고 장기간은 3 년이라고 가정 해 봅시다. 3 년의 기간보다 3 개월의 기간 내에 3 건의 사고가 발생할 가능성이 더 높다고 생각하는 것은 비논리적 인 것 같습니다. 우리가 첫 번째 사고를 주어진 것으로 생각하더라도, 향후 3 년 이내에 비해 향후 3 개월 내에 2 건의 사고가 더 발생할 것이라고 생각하는 것은 비논리적입니다. 그것이 사실이라면, 뉴스 미디어 헤드 라인은 오도되고 부정확합니다. 뭔가 빠졌습니까?


1
설명을 다시 : 확률 , 단위 시간당 확률기대 를 구분하는 것이 도움이 될 수 있습니다 . 희귀 사건을 기술하는 프로세스는 실질적으로 "희귀 한"이라는 의미로 사건 사이에 예상되는 시간 이 길지만 , 단위 시간당 확률 이 처음에는 가장 크지 않다 . 그럼에도 불구하고 짧은 시간 내에 다음에 일어날 사건 의 확률 은 매우 작습니다.
whuber

2
또한, 나는이 위키 백과 기사를 보았습니다 . 아, 그리고 나는이 PDF를 보았습니다. 비행기 충돌의 "클러스터링"에 대해 특별히 언급했습니다 (그리고 지금까지보다 훨씬 더 문제를 설명합니다 ...).
Steve S

1
@Glen_b : 신문 기사의 결함 (내 게시물의 제목 인 기사 제목에 포함됨)은 기사에서 주어진 수 (즉, 클러스터)의 사고가 발생할 확률이 높다는 것을 나타냅니다. 더 긴 기간보다 짧은 기간. 그건 틀렸어
Joel W.

1
@JoelW .: 만약 그렇다면, 망친 기자 일 것입니다 ... 어쨌든, 모든 것이 지워졌거나 여전히 예약이 남아 있습니까?
Steve S

1
제 생각 엔 기자를 오해 한 것은 통계 학자였습니다. 나는 언론인이 스스로 잘못했다고 의심합니다 (반 직관적이기 때문에).
Joel W.

답변:


3

요약 : 인용 된 BBC 단락의 첫 번째 문장은 조잡하고 오해의 소지가 있습니다.

이전 답변과 의견이 이미 훌륭한 토론을 제공했지만 주요 질문에 만족스럽게 답변하지 않았다고 생각합니다.

그래서 우리가 특정 일에 비행기 사고의 확률이 있다고 가정하자 와 충돌이 서로 독립적이라고. 1 월 1 일에 한 비행기가 추락했다고 가정 해 봅시다. 다음 비행기는 언제 추락할까요?=1/365

다음 3 년 동안 매일 다른 비행기가 확률 추락했는지 여부를 무작위로 결정 하고 다음 추락의 날을 기록 하겠습니다 . 이 절차를 반복하겠습니다 100 배 결과 히스토그램은 다음과 같습니다.100000

비행기 충돌, 모델의 분포

실제로 확률 분포는 간단히 주어집니다 . 여기서 t 는 일 수입니다. 이 이론적 인 분포를 빨간색 선으로 표시했으며 Monte Carlo 막대 그래프에 잘 맞는 것을 알 수 있습니다. 비고 : 시간이 더 작고 작은 빈으로 이산 되었다면,이 분포는 기하 급수적으로 수렴합니다. 그러나이 토론에는 실제로 중요하지 않습니다.아르 자형()=(1)

0.27%0.10%

0.8%94% 그렇기 때문에 단조롭게 감소하는 확률 분포에서도 "클러스터"(예 : 3 일 동안 2 개의 비행기 충돌)가 발생하지 않을 가능성이 높습니다.

이 점을 실제로 이해하기위한 또 다른 히스토그램이 있습니다. 교차하지 않는 여러 기간에 대한 이전 히스토그램의 합계입니다.

비행기의 히스토그램은 주파수를 분쇄한다


MIT 교수가 틀렸다고 말하는가?
Steve S

1
BBC 기사에서 Barnett의 인용문은 완전히 정확합니다. 그러나 BBC 기자의 해석은 기묘하다. "Barnett은 Poisson 분포 이론에주의를 기울인다. 이는 충돌 사이의 짧은 간격이 실제로는 긴 간격보다 더 가능성이 높다는 것을 의미한다 . " 이 문장의 가장 자연스러운 해석은 잘못되었습니다 (바넷은 그 의미를 암시하지 않았다고 생각합니다). 어쩌면 나는 답장에서 그것에 대해 더 분명해야합니다. 당신이 동의하지 않는 내 대답의 상당 부분이 있습니까? 당신의 의견에 전적으로 동의하기를 바랍니다.
amoeba는

13

기자의 말에 따르면 비행기 추락의 무작위 발생은 포아송 프로세스 로 모델링 될 수 있습니다 . 이는 일부 (작은) 간격 동안 발생하는 확률이 상기 간격의 길이와 각 발생 위치에 비례하는 상황입니다. 다른 모든 것과 독립적 으로.

설명 된 시나리오에 적합한 모델입니까?

아마.

물론, 다른 조종사들은 추락 후 그들의 행동이 (매우 약간만) 변경 될 수 있기 때문에 이러한 사건들은 100 % 독립적 이지 않을 수 있습니다 . [아는 모르겠다. 아마도 몇몇 조종사들은 시뮬레이터 훈련이나 그와 비슷한 일을 할 것이다.] 그럼에도 불구하고 독립 의 가정 은 여전히 ​​전적으로 합리적입니다.

비행기 충돌 클러스터는 어떻습니까?

예. 포아송 과정 (또는 다른 임의의 프로세스)을 감안할 때, 당신은 것입니다 발생의 일부 클러스터를 볼 것으로 예상.

실제로, Poisson Process ( "임의의 수학적 설명") 에 대한 옥스포드 사전 통계 에 설명 된 바와 같이 :

[R]andomness usually gives rise to apparent clustering, despite the natural
expectation that randomness would lead to regularity.

예를 들어,이 간단한 R 코드를 확인하십시오 .

set.seed(123)
x <- runif(500)
y <- runif(500)

plot(x, y, pch=20, col='blue', main="A Random Distribution of Points")

어떤 생산 :
뭉치지 않습니까?

우리 이것이 랜덤 포인트의 플롯이라는 것을 알고 있지만 , 임의의 랜덤 비트 가있는 것처럼 보입니다. 특히 그래프의 일부 부분에는 다른 점이 있지만 다른 부분은 넓게 열려 있습니다. 기사에서 설명하려는 것과 동일한 종류의 동작입니다 ( 공간 데이터가 아닌 시계열 데이터 만 사용 ).


최신 정보:

@JoelW .: 예를 들어, 내일 비행기가 추락 할 확률은 (또는 그 문제에 대한 하루) 확률은 " p "이고 " p "는 100에서 1과 같습니다.

다음 비행기 충돌이 정확히 1 년 ( 2015 년 7 월 26 일 ) 에 발생할 가능성보다 내일 발생할 가능성이 높은 이유는 다음 충돌이 정확히 1 년일 확률이 다음과 같기 때문입니다.

= Prob(crash tomorrow) * Prob(365 days with *no* crashes)

말이 되나요?

궁극적으로 이러한 것들이 반 직관적 인 이유는 보통 다음과 같은 문구를 생각할 때 발생하기 때문 "The odds of a plane crash in one month compared with the odds of one happening tomorrow"입니다. 우리는 자연스럽게 정확히 한 달에 시작하는 24 시간 기간을 즉시 고려하지 않습니다. 대신, 우리 (또는 적어도 나는)는 그것을 더 유연하게 생각하는 경향이있다 . 더 좋아 : a month ± a week. 그와 우리 가 중간에 발생 하지 않는 충돌의 가능성을 고려하는 것을 잊어 버린 사실은 ... (그러나 다시, 아마도 나일뿐입니다 ...)

휴!


추가 자료 :

  • 클러스터링 환상 에 관한 Wikipedia의 기사
  • 비행기 충돌의 "클러스터링"(8 페이지)과 Poisson 프로세스 의 수학에 대해 간략하게 설명 하는 pdf .

1
@Joel W .: 사실,이 답변에 더 많은 것을 추가해야합니다. 편집 할 시간을 몇 분만주십시오.
Steve S

7
여행 지연에 대한 주장은 TSA가 비행기에 폭탄을 장착 한 통계학자를 어떻게 찾았는지에 대한 오래된 농담에서 나타나는 것과 같습니다. 자신을 설명하도록 요청하는 경우, 통계는 글쎄, 폭탄을 가진 한 사람의 확률은 편안함을 위해 작은 아직 충분히 작은, 그러나 확률 "고 말했다 개의 폭탄을 가진 사람들이 미소입니다. 경우에 따라서 내가 폭탄을 가지고,이 폭탄 2 개가있을 확률은 거의 없으며 우리는 완벽하게 안전 할 것입니다. "
whuber

1
당신의 농담은 @whuber입니다. 그러나 "충돌 사이의 짧은 간격은 실제로 긴 것보다 더 가능성이 높다"는 말과 내일 충돌의 확률은 충돌 여부와 무관하다는 것 사이에는 논리적 분리가있는 것 같습니다 오늘 일어났다. 나는 확률이 반 직관적 일 수 있다고 생각한다.
Joel W.

1
직관적이지 않은 것은 희귀 한 사건이 시간이 가까워지는 경향이 있다는 것입니다. 직관적으로, 드문 사건은 제 시간에 가깝지 않을 것이라고 생각합니다. 그 직관적 인 견해를 가진 유일한 사람입니까?
Joel W.

1
@Steve S : 링크 주셔서 감사합니다. 뉴스 기사 (1/365)의 가정 된 값에 대한 지수 분포는 어떤 모양입니까? 어쨌든 지수 분포는 기사의 헤드 라인을 다루지 않을 것입니다. 이는 짧은 기간 내에 발생하는 주어진 이벤트 수의 확률과 오랜 시간 내에 발생하는 이벤트 수의 확률의 비교를 의미합니다. .
Joel W.

4

비행기 충돌 횟수가 포아송 분포 인 경우 (충돌 한 것으로 보임) 충돌 사이의 시간에 지수 분포가 있습니다. 지수 분포의 pdf는 시간의 단조 감소 함수입니다. 따라서 초기 충돌은 이후 충돌보다 더 가능성이 높습니다.


"충돌 사이의 짧은 간격은 실제로 긴 충돌보다 더 가능성이 높습니다."비행기 충돌이 발생한 경우 다가오는 여행을 모두 지연시켜야한다는 통계와 다른 점은 무엇입니까?
Joel W.

2
Joel, 그 인용은 저자가 "짧은"과 "긴"의 의미를 정량화 할 때까지 의미가 없습니다. 연간 예상 비율이 1 인 사건에 대한 그의 예에서, 다음 달에 재발 할 가능성은 여전히 ​​1 년 후에 다음 충돌이 발생할 가능성보다 훨씬 적습니다. 그가 의미 한 바는 단 시간당 확률 이 장기보다 단기에서 더 크다는 것입니다. 실제 확률을 비교하려면 단위 시간당 확률에 지속 시간을 곱해야합니다 (기술적으로는 지속 시간에 걸쳐이를 통합해야 함).
whuber

@ whuber : 헤드 라인은 비행기 사고가 발생할 확률을 말합니다. 지금까지 스택 교환에 대해 언급 한 것은 비행기 사고의 군집이 넓은 간격의 비행기 사고보다 더 흔하거나 가능성이 높다고 확신하지 못했습니다. 그래서 뉴스 매체의 인용은 오해의 소지가있는 것 같습니다 (아마도 당신이 쓴 시간 간격이 식별되지 않았기 때문일 것입니다). 어떻게 생각해?
Joel W.

나는 "넓은 간격의 비행기 사고"가 무슨 뜻인지 알지 못하며, 그 문제에 대해 "클러스터"가 무엇인지 이해하고 있다고 확신합니다. 상황을 구체적으로 만들기 위해 0, 10, 11, 12 및 22 년 (일부 초기 날짜부터 계산)에 일련의 희귀 사건이 발생한다고 가정합니다. 정확히 "폭이 넓은"이벤트가 몇 번 발생 했습니까? 얼마나 많은 "클러스터"가 발생 했습니까? 첫 번째 질문에 대한 방어 가능한 답변은 0에서 10까지이며 두 번째 질문에 대한 답변은 0 또는 1이 될 수 있습니다.
whuber

1
@whuber : 헤드 라인은 광범위한 사고보다 사고 클러스터가있을 가능성이 더 높다는 것을 의미합니다. 그것을 조작 할 수 있습니다. 군집이 3 건의 비행기 사고이고 단기간은 3 개월이고 장기간은 3 년이라고 가정 해 봅시다. 3 년의 기간보다 3 개월의 기간 내에 3 건의 사고가 발생할 확률이 더 높다고 생각하는 것은 비논리적 인 것 같습니다. 우리가 첫 번째 사고를 주어진 것으로 생각하더라도, 향후 3 년 이내에 비해 향후 3 개월 내에 2 건의 사고가 더 발생할 것이라고 생각하는 것은 비논리적입니다.
Joel W.

0

다른 답변은 이미 독립 이벤트 클러스터링 방법을 다루었습니다 . (그 몇 년 전 글릭의 카오스를 읽으면서이 생각에 눈을 뜨게되었습니다.)

그러나 실제로 비행기 추락은 독립적 인 사건 이 아니라는 강력한 증거가 있습니다. Cialdini 's Influence 는 이것에 대해 아주 좋은 장 을 가지고 있습니다 (또한 여기 에는 데이터에 대한 몇 개의 링크가 있습니다. 그리고 나는 그 책의 해당 부분을 발췌했습니다 ). 분명히 이것은 논란의 여지가 있습니다. 공기 충돌이 더 많이 공개 될수록 비행기가 추락하기 위해 (의식적으로 또는 무의식적으로) 조종사에게 영향을 줄 가능성이 더 높다는 것이 기본적으로 말하고 있습니다. 그러나 가설의 기초가되는 심리적 설명은 그럴듯 해 보이고 데이터도이를 뒷받침하는 것으로 보인다.

(의견에서 통계 기반의 디 벙킹 연구에 대한 링크를 환영합니다.)


"공개 된 자살 이야기의 특정 종류를 즉시 따라 가면 상업 항공사 충돌로 사망하는 사람들의 수가 증가한다"고 말합니다.
Scortchi-Monica Monica 복원

필립스 (1978)는 "살인과 자살에 관한 신문 기사 직후 비행기 사고 사망률이 증가하고있다"고 Science , 201 , pp 748-750이라고 주장한다. 초록은 "개인, 비즈니스 및 기업 실행 비행기"를 나타냅니다.
Scortchi-Monica Monica 복원

또는 아마도 이것 : 필립스 (1980), "비행기 사고, 살인, 대중 매체 : 모방과 제안의 이론으로", Social Forces , 58 , 4, 여기서 "항공사"는 초록에 언급되어 있습니다.
Scortchi-Monica Monica 복원

2
Altheide (1981), Social Forces , 60 , 2는 "유명한 랍비" 의 정의와 같이 차후의 '비행기 충돌 소리'와는 독립적으로 "확실한 종류의 널리 알려진 자살 이야기"가 완전히 정의되지 않았 음을 시사한다 .
Scortchi-Monica Monica 복원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.