일련의 동전 모양으로 머리와 꼬리 패턴을 치는 데 걸린 시간


26

TED 에서 Peter Donnelly의 이야기에서 영감을 받아 일련의 동전 던지기에 특정 패턴이 나타나는 데 걸리는 시간에 대해 이야기합니다. 나는 R에서 다음 스크립트를 만들었습니다. 이 패턴 중 하나에 도달하기까지 평균 시간 (예 : 동전 던지기 횟수)을 계산합니다.

coin <- c('h','t')

hit <- function(seq) {
    miss <- TRUE
    fail <- 3
    trp  <- sample(coin,3,replace=T)
    while (miss) {
        if (all(seq == trp)) {
            miss <- FALSE
        }
        else {
            trp <- c(trp[2],trp[3],sample(coin,1,T))
            fail <- fail + 1
        }
    }
    return(fail)
}

n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))

hth <- c('h','t','h')
htt <- c('h','t','t')

set.seed(4321)
for (i in 1:n) {
    trials[i,] <- c(hit(hth),hit(htt))    
}
summary(trials)

요약 통계는 다음과 같습니다.

      hth             htt        
 Min.   : 3.00   Min.   : 3.000  
 1st Qu.: 4.00   1st Qu.: 5.000  
 Median : 8.00   Median : 7.000  
 Mean   :10.08   Mean   : 8.014  
 3rd Qu.:13.00   3rd Qu.:10.000  
 Max.   :70.00   Max.   :42.000 

대화에서 평균 동전 던지기 수는 두 패턴에서 다를 것이라고 설명합니다. 내 시뮬레이션에서 볼 수 있듯이. 대화를 몇 번 보았지만 여전히 이것이 왜 그런지 잘 모르겠습니다. 나는 'hth'가 그 자체로 겹치며 직관적으로 나는 당신이 'htt'보다 빨리 'hth'를 칠 것이라고 생각할 것이지만, 그렇지 않습니다. 누군가 나에게 이것을 설명 할 수 있다면 정말 감사하겠습니다.

답변:


32

처음 H에 T가 오면 어떻게되는지 생각해보십시오.

사례 1 : 당신은 HTH를 찾고 있습니다 있으며 처음으로 HT를 보았습니다. 다음 던지기가 H라면, 끝났습니다. 그것이 T라면, 당신은 정사각형으로 돌아갑니다. 마지막 두 번의 토스가 TT 였으므로 이제 전체 HTH가 필요합니다.

사례 2 : HTT를 찾고 있습니다 있으며 처음으로 HT를 보았습니다. 다음 던지기가 T라면, 끝났습니다. 그것이 H라면, 이것은 분명히 좌절입니다. 그러나 이제 H가 있고 -TT 만 필요하기 때문에 사소한 것입니다. 다음 번 던지기가 H라면, 상황이 나빠지는 것은 아니지만 T는 개선하는 등입니다.

경우 2를 보면 첫 번째 H가 1/3을 차지하고 그 시점부터 처음부터 시작할 필요가 없습니다. TT가 진행 한 모든 진행 상황을 지우는 경우 1의 경우에는 해당되지 않습니다.


오,이 시나리오에서 한 패턴이 이길 때 동전 뒤집기가 멈추지 않습니다! 말이 되네요 이것은 잠시 동안 나를 혼란스럽게 만들었습니다 (TED 연설을 보지 못했습니다). 동일한 생각을하고있는 다른 사람들을 돕기 위해 의견을 말한 것으로 나타났습니다.

15

당신이 동전을 던져 가정 번과 (중복 포함)는 "HTH"패턴을 참조 횟수를 계산합니다. 예상 숫자는 n 입니다. 그러나 "HTT" 도 n 입니다. 이후 H T H는 자신을 겹칠 수와 "HTT"당신의 첫 등장에 대한 예상 시간을 증가 "HTH", 더 응집 예상 할 수없는 H T H를8+2HHHH .

"HT"에 도달 한 후 "T"는 "HTH"를 시작으로 다시 보내는 반면 "H"는 가능한 "HTT"로 진행하기 시작합니다.

케이케이2케이2+0+8=100+0+8=8

5

그것은 악화 :에 페니의 게임 당신은 인종에 대한 패턴을 선택한 다음 나는 다른을 선택합니다. "HTH"를 선택하면 "HHT"를 선택하고 2 : 1 확률로 승리합니다. "HTT"를 선택하면 "HHT"를 다시 선택하고 여전히 2 : 1 확률로 선호합니다. 그러나 "HHT"를 선택하면 "THH"를 선택하고 3 : 1 확률이 있습니다. 두 번째 플레이어는 항상 확률을 편향시킬 수 있으며 최선의 선택은 전 이적이지 않습니다.


+1 Penney의 게임에 연결해 주셔서 감사합니다. 더 잠들지 않는 밤 :)
lafrasu

헨리님께, 저는 이 사이트에서 비슷한 질문 을했고 여기에서 답을 찾아 보라고했습니다. Penney의 게임을 보았지만 여전히 문제를 해결할 수 없습니다. 도움을 주시면 감사하겠습니다.
superAnnoyingUser

14

나는 그림을 그리는 것을 좋아합니다.

여기에 이미지 설명을 입력하십시오

이 다이어그램은 유한 상태 오토마타 (FSA)입니다. 그들은 작은 어린이 게임입니다 동전 뒤집기에 대한 응답으로 한 노드에서 다른 노드로 토큰을 이동함으로써 HTT 및 HTH 시퀀스를 각각 "인식"또는 "수락"하는 Chutes 및 Ladders와 )입니다. 토큰은 맨 위 노드에서 시작하여 화살표로 표시됩니다 (라인 i )로 표시됩니다. 동전을 던질 때마다 토큰은 동전의 결과 (H 또는 T)로 표시된 가장자리를 따라 다른 노드로 이동합니다 (각각 "H 노드"및 "T 노드"라고 함). 토큰이 터미널 노드 (녹색으로 표시되는 나가는 화살표 없음)에 도달하면 게임이 종료되고 FSA가 시퀀스를 수락 한 것입니다.

각 FSA를 선형 트랙 아래로 수직으로 진행하는 것으로 생각하십시오. 머리와 꼬리의 "오른쪽"순서를 던지면 토큰이 대상쪽으로 진행됩니다. "잘못된"값을 던지면 토큰이 백업됩니다 (또는 최소한 정지 상태입니다). 토큰은 가장 최근 토스에 해당하는 가장 고급 상태로 백업됩니다. 예를 들어, ii 라인의 HTT FSA 는 헤드를 볼 때 ii 라인에 계속 머물러 있습니다. 헤드는 최종 HTH의 초기 시퀀스 일 수 있기 때문입니다. 그것은 않습니다 하지 그 효과적으로 모두이 마지막 머리를 무시하는 것이기 때문에, 처음으로 모든 방법 뒤로 이동합니다.

이 두 게임을 확인한 후 실제로 주장한 HTT와 HTH에 해당하고 한 줄씩 비교하면 HTH가이기는 것이 더 어렵다는 것이 분명해 집니다 . 그것들은 iii 라인에서만 그래픽 구조가 다르며 , H는 HTT를 ii 라인으로 다시 가져오고 (T는 수락) HTH에서 T는 우리를 i 라인으로 다시 가져갑니다 (H는 수락). HTH 경기에서 iii 라인 의 페널티는 HTT 경기에서의 페널티보다 더 심각합니다.

이를 정량화 할 수 있습니다. 이 두 FSA의 노드에 승인에 필요한 예상 토스 수를 표시했습니다. 이것을 노드를 "값"이라고합니다. 라벨링은

(1) 수용 노드에서 명백한 값 0을 씁니다.

머리 확률은 p (H)이고 꼬리 확률은 1-p (H) = p (T)입니다. (공평한 동전의 경우 두 확률은 1/2입니다.) 각 동전 뒤집기는 던지기 횟수에 1을 더하기 때문에,

(2) 노드의 값은 H 노드 값에 1을 더한 p (H) 곱하기와 T 노드 값에 p (T)를 곱한 값을 더한 것입니다.

이러한 규칙에 따라 값이 결정됩니다 . 레이블이 지정된 값 (공정한 동전이라고 가정)이 올바른지 확인하는 것이 빠르고 유익한 연습입니다. 예를 들어, ii 행의 HTH 값을 고려하십시오 . 규칙에 따르면 8은 평균 8 (라인 i 의 H 노드 값 ) 및 6 (라인 iii 의 T 노드 값) 보다 1 이상이어야합니다 . 충분히, 8 = 1 + (1/2) * 8 + (1/2) * 6. 그림에서 나머지 5 개의 값을 쉽게 확인할 수 있습니다.


FSA 접근 방식은 Penney 's Game (@Henry의 답변)을 분석하는 좋은 방법입니다. 값은 약간 다르게 표시됩니다. FSA에는 이제 패턴 당 하나의 허용 노드가 있습니다. 패턴이 이길 가능성을 찾으려면 승인 노드에 1로 레이블을 지정하고 다른 모든 승인 노드에 0으로 레이블을 지정하십시오. 다른 노드의 값은 H 및 T 노드 값의 평균과 같습니다. (고유 한) 시작 노드의 가치는 승리의 기회입니다.
whuber

0

@gung 고맙습니다. 예제를 수정했습니다. 그러나 그림에는 오타가 있습니다. iii 행의 HTT 값은 2가 아니라 4가되어야합니다.
whuber

4

좋은 답변입니다. 나는 약간 다른 압정을 취하고 반 직관적의 문제를 다루고 싶다. (동의합니다, BTW)

내가 이해하는 방법은 다음과 같습니다. 문자 "H"와 "T"로 구성된 종이 테이프에 인쇄 된 무작위 연속 동전 던지기 열을 상상해보십시오.

이 테이프의 한 부분을 임의로 떼어 내고 동일한 사본을 만드십시오.

주어진 테이프에서, 테이프가 충분히 길면 시퀀스 HTH 및 시퀀스 HTT가 각각 자주 발생합니다.

그러나 때때로 HTH 인스턴스, 즉 HTHTH가 함께 실행됩니다. (또는 매우 가끔 HTHTHTH)

이 중복은 HTT 인스턴스에서는 발생할 수 없습니다.

형광펜을 사용하여 성공적인 결과의 "줄무늬", 한 테이프의 HTH 및 다른 테이프의 HTT를 선택하십시오. HTH 줄무늬 중 일부는 겹침으로 인해 짧아집니다. 결과적으로 이들 사이의 간격은 평균적으로 다른 테이프보다 약간 길어집니다.

평균적으로 5 분마다 1 개가있는 버스를 기다리는 것과 비슷합니다. 버스가 서로 겹치는 것이 허용되면 간격이 평균 5 분보다 약간 길어집니다. 두 시간이 지나면지나갑니다.

임의의 시간에 도착하면 다음 버스 (평균적으로)가 겹치도록 허용되는 경우 다음 버스를 기다리는 시간이 약간 더 길어집니다.


2

정수 사례에서 이것에 대한 직감을 찾고있었습니다 (Ros 'Intro. to Probability Models를 통해 훑어 가면서). 그래서 정수 사례에 대해 생각하고있었습니다. 나는 이것이 도움이되는 것을 발견했다.

하자에이 내가 기다리고 있어요 패턴을 시작하는 데 필요한 상징.

하자내가 기다리는 패턴을 완성하는 데 필요한 상징으로 .

에이=(에이~)=0 .

에이(에이~)0 입니다.

다음 추첨에서 패턴을 완성 할 기회가 있다고 상상해 봅시다. 다음 심볼을 그리고 패턴을 완성하지 않습니다. 패턴이 겹치지 않는 경우 그려진 기호로 인해 처음부터 패턴을 다시 빌드 할 수 있습니다.

겹치는 경우 부분 패턴을 완성하는 데 필요한 기호는 재구성을 시작하는 데 필요한 기호와 동일했습니다. 그래서 나는 어느 쪽도 할 수 없으므로 다음 번 추첨 때까지 기다려야 다시 건물을 시작할 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.