비상 대표의 베이지안 분석 : 효과 크기를 설명하는 방법


9

Kruschke의 Doing Bayesian Data Analysis (특히 Poisson 지수 분산 분석) 의 예제를 진행 하고 있습니다. 도 22는 우발 사태 테이블에 대한 빈번한 카이 제곱 독립성 테스트의 대안으로 제시하고있다.

변수가 독립적 인 경우 (예 : HDI가 0을 제외 할 때) 예상보다 많거나 적은 상호 작용에 대한 정보를 얻는 방법을 알 수 있습니다.

내 질문은 이 프레임 워크에서 효과 크기 를 계산하거나 해석하는 방법입니다 . 예를 들어, Kruschke는 "검은 머리와 파란 눈의 조합은 눈 색깔과 머리 색깔이 독립적 인 경우에 예상되는 것보다 덜 빈번하게 발생합니다"라고 기록하지만, 우리는 그 연관성의 강도를 어떻게 설명 할 수 있습니까? 어떤 상호 작용이 다른 사람들보다 더 극단적인지 어떻게 알 수 있습니까? 이러한 데이터에 대해 카이 제곱 테스트를 수행 한 경우 전체 효과 크기의 측정 값으로 Cramér V를 계산할 수 있습니다. 이 베이지안 문맥에서 효과 크기를 어떻게 표현합니까?

여기 R에 답이 숨겨져있는 경우를 대비하여 책에 포함 된 자체 포함 된 예제가 있습니다 ( ).

df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15, 
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond", 
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))

df

         Blue Brown Green Hazel
Black      20    68     5    15
Blond      94     7    16    10
Brunette   84   119    29    54
Red        17    26    14    14

다음은 효과 크기 측정치 (도서에는 없음)가있는 빈번한 결과입니다.

vcd::assocstats(df)
                    X^2 df P(> X^2)
Likelihood Ratio 146.44  9        0
Pearson          138.29  9        0

Phi-Coefficient   : 0.483 
Contingency Coeff.: 0.435 
Cramer's V        : 0.279

다음은 HDI 및 셀 확률이 포함 된 베이지안 출력입니다 (책에서 직접).

# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R", 
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")

# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))

# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))

다음은 데이터에 적용된 포아송 지수 모델의 후부의 플롯입니다.

여기에 이미지 설명을 입력하십시오

추정 된 세포 확률에 대한 사후 분포도 :

여기에 이미지 설명을 입력하십시오

답변:


1

인덱스 당 Kruschke는 효과 크기를 두 번만 언급하며 두 시간 모두 메트릭 예측 변수와 관련이 있습니다. 그러나 p 에이 비트가 있습니다. 601 :

연구원이 독립 위반에 관심이 있다면 관심사는 βrc. 무관심이 발생하는 위치를 결정하기 위해 임의의 상호 작용 대비를 조사 할 수 있기 때문에 모델은이 목적에 특히 편리합니다.

그래서 저는 β1,2해석 할 매개 변수입니다. 허락하다S 모든 계수와 해당 x 요소의 곱의 합을 제외하고 β1,2x1,2. 이후yiPois(λi)λi=eβ1,2x1,2+S=eβ1,2x1,2eS. 언제x1,2 = 1이면 λi 요인으로 증가 또는 축소 eβ1,2, 아니?


1

ANOVA 모델에서 효과 크기를 연구하는 한 가지 방법은 "슈퍼 모집단"및 "유한 모집단"표준 편차를 보는 ​​것입니다. 양방향 테이블이 있으므로 이것은 3 개의 분산 성분 (2 개의 주요 효과 및 1 개의 상호 작용)입니다. 이것은 mcmc 분석을 기반으로합니다. 각 mcmc 샘플에 대한 각 효과의 표준 편차를 계산합니다.

sk=1dk1j=1dk(βk,jβ¯k)2

어디 kANOVA 테이블의 "행"을 색인화합니다. mcmc 샘플의 간단한 상자 그림sk vs k 효과 크기에 매우 유익합니다.

Andrew Gelman은이 접근법을 옹호했습니다. 그의 2005 년 논문 "분산 분석 : 왜 그 어느 때보 다 중요한지"를 참조하십시오.


그 종이는 여기에서 구할 수 있습니다 .
Sean Easter

이 두 가지 답변 모두 매우 유망한 것으로 보입니다. 감사합니다. R프로그래밍 방법을 보여줄 정도로 익숙 하십니까?
Ben

@seaneaster-링크를 추가해 주셔서 감사합니다. @ben, 이러한 계산은 R에서 간단합니다. 그러나 샘플이 어떤 형식인지 확실하지 않습니다. sd ()"적용"기능 중 하나와 결합 하여 사용할 수 있어야 합니다. 박스 플롯에 관해서는 이것으로 기본 것들을 얻는 것이 간단합니다 boxplot ().
probabilityislogic

고마워, 내 질문에 예제 데이터와 코드를 사용하여 시연 할 수 있습니까?
Ben

요컨대, 게시 한 코드를 이해하지 못하기 때문에 아니요. 데이터가 어떻게 구성되어 있는지 볼 수 없습니다. 그리고 내가 말했듯이, 이것은 스스로하기 어려운 분석이 아닙니다. 이 접근법은 간단한 측정 (표준 편차)을 계산합니다. 또한 R 코딩은 귀하의 질문의 일부가 아닙니다. 우발 상황 테이블 분석을 요약하는 방법에 대해 문의했습니다.
probabilityislogic
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.