여기서 데이터에 베이지안 로짓을 실행하려고합니다 . R의 패키지에서 사용 bayesglm()하고 있습니다 arm. 코딩은 간단합니다.
df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T)
library(arm)
model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df)
summary(model) 다음과 같은 출력을 제공합니다.
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.10381 0.10240 1.014 0.311
SEXMale 0.02408 0.09363 0.257 0.797
HIGH -0.27503 0.03562 -7.721 1.15e-14 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 2658.2 on 1999 degrees of freedom
Residual deviance: 2594.3 on 2000 degrees of freedom
AIC: 2600.3
이 과정을 안내해주세요. 이 코드는 매우 약한 이전을 사용한다는 것을 이해합니다 (사전 수단을 지정하지 않았기 때문에) glm()대신 대신 사용하면 출력이 실제로 동일합니다 bayesglm(). 그러나 결과는 여전히 베이지안 정신에 있어야합니다. 여기서 과 은 무엇입니까 ? 이 빈번한 추론 도구가 아닌가요? 그들은 여기서 다르게 해석됩니까?Z
이것은 의견이며 답변은 아니지만 이것은 나에게 어떤 의미가 있습니다. 사후 분포가 최대화 될 수있는 값인 추정값을 얻습니다. 그것들이 단지 후부의 수단 일 수도 있을까요? 당신이 할 수 있는지 확인 가치가 있습니다. 그러나 정확한 세부 사항이 무엇이든, 추정치가 있으면 일반적인 추정 / 표준으로 테스트 할 수 있습니다. 오류-> z- 점수 프로시 저는 후방이 정상에 충분히 근접한 경우 작동합니다 (보통 유지되는 일부 조건에서는 정상으로 진행됨).
—
Erik
에릭 ... 당신 말이 맞아요. 계수는 실제로 후방 밀도의 수단입니다. 내 질문은 p 값과 z 값에 관한 것입니다. 그들은 여기서 무엇을 상징합니까?
—
user3671
확인. 밀도가 대략 정규 분포 인 경우 분포의 z- 점수 = 평균 / 표준 편차를 취하여 표준 정규 분포와 비교하여 평균이 0인지 여부를 테스트 할 수 있습니다. 그런 다음 귀하의 가치 또는 더 큰 가치가 표준 정규 분포-> p- 값에 미치지 못할 가능성을 확인하십시오. 자세한 내용은 Wikipedia의 z- 점수를 참조하십시오.
—
Erik
그래 그러나 베이지안 환경에서 왜 그렇게 귀찮게합니까? 베이지안 추론에서 점 추정치는 랜덤 모수에 대한 가장 좋은 추측이므로 테스트 할 필요가 없습니다. 최대한 자주 "신뢰할 수있는 간격"을 포함 할 수 있는데, 이는 빈번한 "신뢰 간격"과 동일하지만 통계 해석이 크게 다릅니다. summary () 출력에 대한 혼란스러운 부분입니다. 정신은 베이지안이지만 결과물은 빈번합니까?
—
user3671
한 가지 요점은 이전을 사용했기 때문에 추정치가 달라진다는 것입니다. 그리고 어떤 점이 효과가 있다는 것을 베이지안 방식으로 나타내려면 점 추정치가 "가장 추측"이지만 신뢰할 수있는 구간에 0이 포함되어 있지 않음을 보여 주려고합니다. 평균이 같고 sd (무조건적으로 올바른) 인 정규선으로 후방을 근사 할 때 (1-p / 2) 신뢰 구간은 0을 포함하는 가장 큰 대칭 신뢰 구간이므로 답은 기본적으로 동일합니다. p는 상기 언급 된 p- 값이다.
—
Erik