좋은 공연이 줄무늬로 나오는지 어떻게 알 수 있습니까?


10

나는 루빅스 큐브를 취미로 해결한다. 몇 가지 소프트웨어를 사용하여 큐브를 해결하는 데 걸린 시간을 기록하여 수천 가지 해결 데이터를 얻었습니다. 데이터는 기본적으로 각 순차 해결에 걸린 시간을 나타내는 긴 숫자 목록입니다 (예 : 22.11, 20.66, 21.00, 18.74, ...)

큐브를 해결하는 데 걸리는 시간은 자연스럽게 해결하는 데 약간 씩 다르므로 해결 방법이 우수합니다.

나는 "뜨거워지는"것인지 알고 싶습니다-좋은 해결책이 줄무늬로 나오는지. 예를 들어, 몇 번의 연속적인 좋은 해결이 있었다면 다음 해결이 좋을 가능성이 더 큽니까?

어떤 종류의 분석이 적합합니까? 예를 들어 해결 방법을 Markov 프로세스로 처리하고 해결 방법이 다음을 얼마나 잘 예측하는지 확인하고 임의의 데이터와 비교하여 연속 해결의 가장 긴 줄이 마지막 중앙값 아래로 얼마나 오래 지속되는지 확인하는 등 몇 가지 특정 작업을 생각할 수 있습니다. 100은 랜덤 데이터 등에서 예상되는 것과 비교하고 있습니다. 이러한 테스트가 얼마나 통찰력이 있는지 잘 모르겠으며 이러한 종류의 문제에 대해 잘 개발 된 접근법이 있는지 궁금합니다.

답변:


8

월드 - 울포위츠는 테스트 실행 에 "실행이"당신이 "행진"이라는 것입니다 가능한 후보가 될 것으로 보인다. 이분법적인 데이터가 필요하므로 제안한 평균 시간과 같은 일부 임계 값에 따라 각 해결 방법을 "나쁜"대 "양호한"레이블로 지정해야합니다. 귀무 가설은 "좋은"과 "나쁜"이 교대로 무작위로 해결된다는 것입니다. 직감에 해당하는 일측 대안 가설은 "양호"가 긴 줄에서 덩어리를 함께 해결하여 임의의 데이터에서 예상보다 실행이 적다는 것을 의미합니다. 테스트 통계량은 실행 횟수입니다. R에서 :

> N      <- 200                          # number of solves
> DV     <- round(runif(N, 15, 30), 1)   # simulate some uniform data
> thresh <- median(DV)                   # threshold for binary classification

# do the binary classification
> DVfac <- cut(DV, breaks=c(-Inf, thresh, Inf), labels=c("good", "bad"))
> Nj    <- table(DVfac)                  # number of "good" and "bad" solves
> n1    <- Nj[1]                         # number of "good" solves
> n2    <- Nj[2]                         # number of "bad" solves
> (runs <- rle(as.character(DVfac)))     # analysis of runs
Run Length Encoding
lengths: int [1:92] 2 1 2 4 1 4 3 4 2 5 ...
values : chr [1:92] "bad" "good" "bad" "good" "bad" "good" "bad" ...

> (nRuns <- length(runs$lengths))        # test statistic: observed number of runs
[1] 92

# theoretical maximum of runs for given n1, n2
> (rMax <- ifelse(n1 == n2, N, 2*min(n1, n2) + 1))
199 

관측치가 적은 경우 귀무 가설 하에서 각 런 수에 대한 정확한 확률을 계산할 수 있습니다. 그렇지 않으면, "실행 횟수"의 분포는 표준 정규 분포로 근사 할 수 있습니다.

> (muR  <- 1 + ((2*n1*n2) / N))                     # expected value
100.99 

> varR  <- (2*n1*n2*(2*n1*n2 - N)) / (N^2 * (N-1))  # theoretical variance
> rZ    <- (nRuns-muR) / sqrt(varR)                 # z-score
> (pVal <- pnorm(rZ, mean=0, sd=1))                 # one-sided p-value
0.1012055

p- 값은 "양호한"해를 구하는 단선 대체 가설에 대한 것입니다.


3
좋은 대답입니다. 그러나 연속 변수를 이진 변수로 변환하는 것을 꺼려합니다. 의미있는 가변성이 많이 손실됩니다.
Jeromy Anglim

@jeromy-이것은 일반적으로 좋은 지적이지만,이 특정 질문에 대해서는 binning이 많은 정보를 버리지 않습니다. 특히 "good"과 "bad"는 질문에서 이분법으로 정의되지 않습니다. 연속체.
chanceislogic

@probabilityislogic @mark는 솔루션 시간이 어느 임계 값의 어느쪽에 있는지에 따라 솔루션 시간이 "양호"또는 "나쁨"으로 작동 할 수 있음을 이해합니다. 그러나 임계 값이있는 곳이면 반드시 임의적입니다. 임계 값이 5 분인 경우, "goodness"에서 5 분 1 초는 4 분 59 초와 크게 다르지 않습니다. 나는 "완료"와 "나쁜"이 연속 완료 시간과 관련하여 퍼지 범주라고 생각합니다.
Jeromy Anglim 2016 년

그러나 "좋은"과 "나쁜"의 정의는 그 단어의 상대적 특성 때문에 임의적입니다. "데이터"가 모호성을 해결하든 직접 해결하든 모호하게 만들지 않습니다. 그리고 경쟁에서 결승에 진출하기 위해 5 분 미만이 필요한 경우 그러한 뚜렷한 구별이 필요합니다. 나는 확실히 판사는 종류의 인자에 의해 좌우되지 않습니다 "하지만 자격을 시간 밖에 단지 2 초였다"야
probabilityislogic

5

몇 가지 생각 :

  • 시간 분포를 플로팅합니다. 내 생각에 그들은 약간의 솔루션 시간이 실제로 느리도록 긍정적으로 기울어 질 것입니다. 이 경우 로그 또는 솔루션 시간의 다른 변환을 고려할 수 있습니다.

  • x 축 및 시험 시간 (또는 y 축 시험 시간)에 대한 산포도를 산포합니다. 이를 통해 데이터를 직관적으로 이해할 수 있습니다. 또한 "핫 스트릭 (hot streak)"외에 다른 종류의 트렌드를 나타낼 수도 있습니다.

  • 시간이 지남에 따라 학습 효과가 있는지 고려하십시오. 대부분의 퍼즐을 사용하면 연습을 더 빨리 할 수 ​​있습니다. 플롯은 이것이 사실인지를 밝히는 데 도움이됩니다. 이러한 효과는 "핫 스트릭"효과와 다릅니다. 처음 학습 할 때 느린 시험은 다른 느린 시험과 함께 발생하고 경험이 많을수록 빠른 시험은 빠른 시험과 함께 발생하므로 시험간에 상관 관계가 발생합니다.

  • "핫 줄무늬"에 대한 개념적인 정의를 고려하십시오. 예를 들어, 시간이 가까워 지거나 질서가 근접한 시험에만 적용됩니까? 화요일에 큐브를 빨리 풀었 다가 휴식을 취했고 다음 주 금요일에 큐브를 빨리 풀 었다고 가정 해 봅시다. 이것은 열병입니까, 아니면 같은 날에 할 경우에만 계산됩니까?

  • 뜨거운 줄무늬 효과와 다른 다른 효과가 있습니까? 예를 들어, 퍼즐을 풀어야하는 시간 (예 : 피로), 실제로 열심히 노력하고있는 정도? 기타

  • 대안적인 체계적 효과가 이해되면 가능한 많은 효과를 포함하는 모델을 개발할 수 있습니다. y 축에 잔차를 플로팅하고 x 축에 시험을 시도 할 수 있습니다. 그런 다음 모형의 잔차에 자동 상관이 있는지 확인할 수 있습니다. 이 자동 상관 관계는 열선의 일부 증거를 제공합니다. 그러나 다른 해석으로는 제외하지 않은 다른 체계적인 효과가 있다는 것입니다.


체계적인 부분의 경우 +1 이 경우 성능 변화에 대한 가장 좋은 설명이라고 생각합니다.
mpiktas

2
연구원들이이 질문을 어떻게 조사했는지 살펴보고 싶을 것입니다. 고전은 Gilovich, T., Vallone, R. & Tversky, A.입니다. 농구의 뜨거운 손 : 무작위 시퀀스의 오해. 인지 심리학 17, 295-314 (1985).
dmk38

2

프로세스의 상관 관계 를 계산 하십시오. 공정이 가우시안이면 (샘플의 모양에 따라) 하한 / 상한 (B)을 설정하고 주어진 지연에서 상관이 유의한지 확인할 수 있습니다. 지연 1에서 양의 자기 상관은 "행운의 줄무늬"가 있음을 나타냅니다.


2
긍정적 자기 상관은 학습 과정과 같은 다른 체계적인 영향으로 인해 발생할 수도 있습니다. 나는 자기 상관을 "뜨거운 행진"의 증거로 해석하기 전에 그러한 영향을 제거하는 것이 중요하다고 생각합니다.
Jeromy Anglim
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.