"이전 상태"가 R의 "후속 상태"에 영향을 미치는지 테스트하는 방법


10

상황을 상상해보십시오. 우리는 3 개의 광산에 대한 역사적 기록 (20 년)을 가지고 있습니다. 은이 있으면 내년에 금을 찾을 확률이 높아 집니까? 그러한 질문을 테스트하는 방법?


여기에 이미지 설명을 입력하십시오

예제 데이터는 다음과 같습니다.

mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
            "rock","rock","rock","rock","silver","rock","rock",
            "rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
            "silver","gold","gold","gold","gold","gold","rock",
            "silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
            "rock","silver","rock","rock","rock","rock","silver",
            "gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)


1
전이 행렬 계산에 관심이있을 수 있습니다 .
Andy W

안녕하세요 @AndyW! 의견 감사합니다. 전환 매트릭스 패키지에 익숙합니다 .makkovchain-markovchainFit (). 전환 행렬의 확률 값을 p- 값으로 사용할 수 있습니까? 가설을 테스트하는 방법이 있습니까? ""은색 "관계가 있습니다. (p- 값 = xx)?
Ladislav Naďo

1
@LadislavNado 전환 확률은 p- 값으로 해석 될 수 없습니다 (H0 거부에 대해 아무 것도 알려주지 않음) . p- 값에 대한 자세한 내용은 stats.stackexchange.com/questions/31/… 을 참조하십시오 .
Tim

1
데이터 추출 방법에 문제가 있습니다. "실버 : 아니오"및 "골드 : 예"시나리오를 고려하십시오. 논리 조건을 충족하므로 연속 "골드"실행을 계산해야합니다.

1
하나의 셀이 1에서 14로 수정되면 모델은 다음과 같이 변경됩니다. Coefficients : Estimate Std. 오류 z 값 Pr (> | z |) (절편) -1.2528 0.8018 -1.562 0.118 계수 (c (0, 1)) 1 0.3655 0.8624 0.424 0.672

답변:


4

최선의 시도 : ... @AndyW가 제안한 전이 행렬의 사용법은 아마도 내가 찾고있는 해결책이 아닐 것입니다 (@Tim의 의견에 따라). 그래서 다른 접근법을 시도했습니다. 응답 변수 y와 예측 변수 x가 모두 이진 인 로지스틱 회귀 분석 방법을 다루는 이 링크 를 찾았습니다 .

예에 따르면 내 데이터를 기반으로 2 × 2 테이블을 만들어야합니다.

               gold (yes)  gold (no)
silver (yes)       2           7
silver (no)       14          34

값을 추출한 방법 : 여기에 이미지 설명을 입력하십시오

그리고 모델을 구성하십시오.

response <- cbind(yes = c(2, 14), no = c(7, 34))

mine.logistic <- glm(response ~ as.factor(c(0,1)),
                      family = binomial(link=logit))

summary(mine.logistic)
# Coefficients:
#                     Estimate Std. Error z value Pr(>|z|)
# (Intercept)          -1.2528     0.8018  -1.562    0.118
# as.factor(c(0, 1))1   0.3655     0.8624   0.424    0.672

좋은 해결책입니까? p- 값 (0.673)은 은의 존재가 금을 찾을 확률을 증가시키지 않는다는 것을 의미합니까?


이 멋진 차트를 어떻게 생성 했습니까? 티크?
shadowtalker

안녕 @ ssdecontrol! Inkscape에서 손으로 차트를 만들었습니다.
Ladislav Naďo

예, 괜찮은 해석입니다. 또한 2x2 테이블의 행을 보면 맨 위 행 (은 : 예)에 9 개의 사례가 있으며 그 중 2 개에 금이 있었으므로 내년에 금의 확률은 2/9 = 0.222입니다. 맨 아래 줄 (은 : 아니요)에는 48 개의 사례가 있으며 그 중 14 개는 내년에 금이 있었으므로 은의 확률은 14 / (14 + 34) = 0.292가 아닙니다. 모든 것을 감안할 때, 은은 당신의 p- 값에서 "통계적으로 유의미하지"않지만 금을 찾을 가능성을 상하게 하는 것처럼 보입니다 .
Gregor Thomas

또한 코딩을 염두에두고 시작 yes = c(2, 14), no = c(7, 34)하십시오. 즉, Silver : yes를 먼저 두는 것입니다. 그래서 당신이 할 as.factor(c(0, 1))때 0은은에 해당합니다. 그렇습니다. 0.67 p- 값은 silver : yes에서 silver : no로 이동하는 금을 찾을 확률이 작은 양의 범프에 해당합니다.
Gregor Thomas

마지막 코멘트 : 당신이 하는 전환 행렬을 사용하여. 2, 7, 14, 34 행렬은 전이 행렬입니다.
Gregor Thomas
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.