일련의 관찰 된 시퀀스가 마르코프 체인 인 것 같습니다.
그러나 그들이 실제로 의 메모리없는 속성을 존중하는지 어떻게 확인할 수
아니면 적어도 그들이 본질적으로 마르코프임을 증명합니까? 이들은 경험적으로 관찰 된 서열이다. 이견있는 사람?
편집하다
덧붙여서, 목표는 관찰 된 순서와 예측 된 순서를 비교하는 것입니다. 그래서 우리는 이것을 비교하는 가장 좋은 방법에 대한 의견에 감사드립니다.
1 차 전이 행렬
M 고유 값
M 고유 벡터
일련의 관찰 된 시퀀스가 마르코프 체인 인 것 같습니다.
그러나 그들이 실제로 의 메모리없는 속성을 존중하는지 어떻게 확인할 수
아니면 적어도 그들이 본질적으로 마르코프임을 증명합니까? 이들은 경험적으로 관찰 된 서열이다. 이견있는 사람?
편집하다
덧붙여서, 목표는 관찰 된 순서와 예측 된 순서를 비교하는 것입니다. 그래서 우리는 이것을 비교하는 가장 좋은 방법에 대한 의견에 감사드립니다.
1 차 전이 행렬
M 고유 값
M 고유 벡터
답변:
다음이 다음과 같은 비율에 대해 유효한 Pearson 테스트를 제공하는지 궁금 합니다.
전체 T ~ χ 2 12가 되도록 각 T U ~ χ 2 3 을 생각하는 것이 유혹 입니다 . 그러나 나는 그것을 완전히 확신하지 못하며 이것에 대한 당신의 생각에 감사드립니다. 나는 마찬가지로 하나의 요구가 독립에 대한 편집증이 될 것인지 여부에 대한 공동 sertain하지 아닙니다, 그리고 추정 절반에 샘플을 분할 할 것입니다 페이지 와 ˉ 페이지를 .
Markov 속성은 직접 테스트하기 어려울 수 있습니다. 그러나 Markov 속성을 가정 한 모델이 적합하고 모델 보유 여부를 테스트하는 것으로 충분할 수 있습니다. 적합 모델은 실제로 유용한 근사치이며 Markov 속성이 실제로 보유되는지 여부에 대해 걱정할 필요가 없습니다.
선형 회귀에 평행을 그릴 수 있습니다. 일반적인 관행은 선형성이 유지되는지 여부를 테스트하는 것이 아니라 선형 모델이 유용한 근사치인지 여부를 테스트하는 것입니다.
이전 응답의 제안을 구체화하려면 먼저 Markov라고 가정하고 Markov 확률을 추정하려고합니다. 여기에 응답을 참조하십시오 산정 마르코프 체인 확률
상태 A에서 A, A에서 B 등으로의 전환 비율을 기반으로 4 x 4 행렬을 합니다. 이 행렬 M을 호출하십시오 . M2는 2 단계 전이 행렬이어야합니다. 관측 된 2 단계 전이 행렬이 M 2 와 유사한 지 테스트 할 수 있습니다 .
상태 수에 대한 많은 데이터 가 있으므로 데이터의 절반에서 을 추정 하고 다른 절반을 사용하여 M 2 를 테스트 할 수 있습니다. 다항식의 이론적 확률에 대해 관측 된 빈도를 테스트합니다. 그것은 당신이 얼마나 멀리 있는지에 대한 아이디어를 줄 것입니다.
또 다른 가능성은 기본 상태 비율 (A에 소비 된 비율 시간, B에 소비 된 시간)이 M의 단위 고유 값의 고유 벡터와 일치하는지 여부를 확인하는 것입니다. 계열이 일정한 상태에 도달하면 각각의 시간 비율 상태는 그 한계에 도달해야합니다.
Markov 속성 (MP) 이외 의 추가 속성은 Time Homogeneity (TH)입니다. 는 Markov가 될 수 있지만 시간 t 에 따라 전이 행렬 P ( t )가 있습니다. 예, 그것은에서 요일에 따라 달라질 수 있습니다 t 관찰 매일 경우, 다음 의존도 X t 에 X t - 7 조건에 X t - 1 TH가 과도하게 가정하면 진단 할 수있다.
가정 TH는 MP가 취할 수있는 검사가 검사되고, 유지 독립적으로 X t - 2 조건에서 X t - 1 마이클 Chernick 및 StasK 제안한다. 우발 사고 테스트 테이블을 사용하여이를 수행 할 수 있습니다. 우리는 만들 수 N 개의 의 비상 테이블 X t 및 X t - 2 조건부 { X t - 1 = X J } 대한 N 개의 가능한 값 X J를독립성을 테스트합니다. 이것은 또한 사용하여 수행 할 수 있습니다 로 ℓ > 1 대신에 X의 t - 2 .
R에서, 비상 테이블 또는 배열은 쉽게 덕분에 생산 요소의 시설과 기능을 apply,
sweep. 위의 아이디어는 그래픽으로 활용할 수도 있습니다. 패키지 ggplot2 또는 격자 는 조건부 분포 를 비교하기위한 조건부 플롯을 쉽게 제공합니다 . 예를 들어 i 를 행 인덱스 및 j 로 설정 trellis의 컬럼 인덱스는 MP에서 컬럼 내에서 유사한 분포를 가져야합니다.
챕터. 책 5 시간 확률 프로세스의 통계적 분석 JK 의해 린지는 가정을 확인하기위한 다른 아이디어를 포함한다.

[## simulates a MC with transition matrix in 'trans', starting from 'ini'
simMC <- function(trans, ini = 1, N) {
X <- rep(NA, N)
Pcum <- t(apply(trans, 1, cumsum))
X[1] <- ini
for (t in 2:N) {
U <- runif(1)
X[t] <- findInterval(U, Pcum[X[t-1], ]) + 1
}
X
}
set.seed(1234)
## transition matrix
P <- matrix(c(0.1, 0.1, 0.1, 0.7,
0.1, 0.1, 0.6, 0.2,
0.1, 0.3, 0.2, 0.4,
0.2, 0.2, 0.3, 0.3),
nrow = 4, ncol = 4, byrow = TRUE)
N <- 2000
X <- simMC(trans = P, ini = 1, N = N)
## it is better to work with factors
X <- as.factor(X)
levels(X) <- LETTERS[1:4]
## table transitions and normalize each row
Phat <- table(X[1:(N-1)], X[2:N])
Phat <- sweep(x = Phat, MARGIN = 1, STATS = apply(Phat, 1, sum), FUN = "/")
## explicit dimnames
dimnames(Phat) <- lapply(list("X(t-1)=" ,"X(t)="),
paste, sep = "", levels(as.factor(X)))
## transition 3-fold contingency array
P3 <- table(X[1:(N-2)], X[2:(N-1)], X[3:N])
dimnames(P3) <- lapply(list("X(t-2)=", "X(t-1)=" ,"X(t)="),
paste, sep = "", levels(as.factor(X)))
## apply ONE indendence test
fisher.test(P3[ , 1, ], simulate.p.value = TRUE)
## plot conditional distr.
library(lattice)
X3 <- data.frame(X = X[3:N], lag1X = X[2:(N-1)], lag2X = X[1:(N-2)])
histogram( ~ X | lag1X + lag2X, data = X3, col = "SteelBlue3")
]
나는 placida와 mpiktas가 매우 사려 깊고 훌륭한 접근 방식을 제공했다고 생각합니다.
값을 선택합니다.
그런 다음 검정 통계량은 이러한 추정 비율의 차이입니다. 베르누이 서열의 표준 비교에 대한 합병증은 이들이 서로 관련되어 있다는 것이다. 그러나이 경우 이항 비율의 부트 스트랩 테스트를 수행 할 수 있습니다.
. By the law of total variance,
The LHS, if it is almost zero, provides evidence that the transition probabilities do not depend on , though it is clearly a weaker statement: e.g., let . Taking the expected value of both sides of the above equation, the RHS can be computed from the sample variances (i.e., replacing expected values with averages). If the expected value of the variance is zero then the variance is 0 almost always.