장난감 모델에서 데이터 시뮬레이션을 시작합니다. 다음과 같은 것 :
n.games <- 1000
n.slices <- 90
score.away <- score.home <- matrix(0, ncol=n.slices, nrow=n.games)
for (j in 2:n.slices) {
score.home[ ,j] <- score.home[ , j-1] + (runif(n.games)>.97)
score.away[ ,j] <- score.away[ , j-1] + (runif(n.games)>.98)
}
이제 우리는 가지고 놀 것이 있습니다. 원시 데이터를 사용할 수도 있지만 데이터를 시뮬레이션하면 생각을하는 데 매우 도움이됩니다.
다음으로, 데이터, 즉 게임 대 리드 홈의 플롯 시간을 플롯하여 승리 확률에 해당하는 색상 스케일을 플롯합니다.
score.dif <- score.home-score.away
windf <- data.frame(game=1:n.games, win=score.home[ , n.slices] > score.away[, n.slices])
library(reshape)
library(ggplot2)
dnow <- melt(score.dif)
names(dnow) <- c('game', 'time', 'dif')
dnow <- merge(dnow, windf)
res <- ddply(dnow, c('time', 'dif'), function(x) c(pwin=sum(x$win)/nrow(x)))
qplot(time, dif, fill=pwin, data=res, geom='tile') + scale_color_gradient2()
이를 통해 데이터 지원을 찾고 확률이 어떤지에 대한 기본적인 아이디어를 얻을 수 있습니다.