베이지안 glm의

여기서 데이터에 베이지안 로짓을 실행하려고합니다 . R의 패키지에서 사용 bayesglm()하고 있습니다 arm. 코딩은 간단합니다.

df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T)
library(arm)
model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df)

summary(model) 다음과 같은 출력을 제공합니다.

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  0.10381    0.10240   1.014    0.311    
SEXMale      0.02408    0.09363   0.257    0.797    
HIGH        -0.27503    0.03562  -7.721 1.15e-14 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2658.2  on 1999  degrees of freedom
Residual deviance: 2594.3  on 2000  degrees of freedom
AIC: 2600.3

이 과정을 안내해주세요. 이 코드는 매우 약한 이전을 사용한다는 것을 이해합니다 (사전 수단을 지정하지 않았기 때문에) glm()대신 대신 사용하면 출력이 실제로 동일합니다 bayesglm(). 그러나 결과는 여전히 베이지안 정신에 있어야합니다. 여기서 과 은 무엇입니까 ? 이 빈번한 추론 도구가 아닌가요? 그들은 여기서 다르게 해석됩니까? $p$ $z$

r bayesian p-value

— 사용자 3671
소스

이것은 의견이며 답변은 아니지만 이것은 나에게 어떤 의미가 있습니다. 사후 분포가 최대화 될 수있는 값인 추정값을 얻습니다. 그것들이 단지 후부의 수단 일 수도 있을까요? 당신이 할 수 있는지 확인 가치가 있습니다. 그러나 정확한 세부 사항이 무엇이든, 추정치가 있으면 일반적인 추정 / 표준으로 테스트 할 수 있습니다. 오류-> z- 점수 프로시 저는 후방이 정상에 충분히 근접한 경우 작동합니다 (보통 유지되는 일부 조건에서는 정상으로 진행됨).

— Erik

에릭 ... 당신 말이 맞아요. 계수는 실제로 후방 밀도의 수단입니다. 내 질문은 p 값과 z 값에 관한 것입니다. 그들은 여기서 무엇을 상징합니까?

— user3671

확인. 밀도가 대략 정규 분포 인 경우 분포의 z- 점수 = 평균 / 표준 편차를 취하여 표준 정규 분포와 비교하여 평균이 0인지 여부를 테스트 할 수 있습니다. 그런 다음 귀하의 가치 또는 더 큰 가치가 표준 정규 분포-> p- 값에 미치지 못할 가능성을 확인하십시오. 자세한 내용은 Wikipedia의 z- 점수를 참조하십시오.

— Erik

그래 그러나 베이지안 환경에서 왜 그렇게 귀찮게합니까? 베이지안 추론에서 점 추정치는 랜덤 모수에 대한 가장 좋은 추측이므로 테스트 할 필요가 없습니다. 최대한 자주 "신뢰할 수있는 간격"을 포함 할 수 있는데, 이는 빈번한 "신뢰 간격"과 동일하지만 통계 해석이 크게 다릅니다. summary () 출력에 대한 혼란스러운 부분입니다. 정신은 베이지안이지만 결과물은 빈번합니까?

— user3671

한 가지 요점은 이전을 사용했기 때문에 추정치가 달라진다는 것입니다. 그리고 어떤 점이 효과가 있다는 것을 베이지안 방식으로 나타내려면 점 추정치가 "가장 추측"이지만 신뢰할 수있는 구간에 0이 포함되어 있지 않음을 보여 주려고합니다. 평균이 같고 sd (무조건적으로 올바른) 인 정규선으로 후방을 근사 할 때 (1-p / 2) 신뢰 구간은 0을 포함하는 가장 큰 대칭 신뢰 구간이므로 답은 기본적으로 동일합니다. p는 상기 언급 된 p- 값이다.

— Erik

좋은 질문입니다! 가 있지만 베이지안 P-값 , 팔 패키지의 저자 중 하나가 옹호, 당신이 당신의 출력에서보고있는 것은 없습니다 베이지안 p- 값. 수업 확인model

class(model)
"bayesglm" "glm"      "lm"

그리고 bayesglm 클래스는 glm에서 상속한다는 것을 알 수 있습니다. 또한, 팔 패키지의 검사는 베이 즈 글렘 객체에 대한 특정 요약 방법을 보여주지 않는다. 그래서 당신이 할 때

summary(model)

당신은 실제로하고 있습니다

summary.glm(model)

그리고 결과에 대한 빈번한 해석을 얻는 것 . 더 베이지안 관점을 원한다면 팔의 기능은display()

— atiretoo-복원 모니카
소스

+1 우수 답변! 이것은 R의 문제입니다. 지능적인 통계학자가 너무 많아서 이런 종류의 지뢰를 둘러싸고 있습니다.

— Bogdanovist

감독이 아닌 디자이너 의 의도적 인 선택 인 것 같습니다 .

— atiretoo-복원 모니카

링크를 읽은 후 나는 의도에 동의하지만,이 경우 summary ()는 경고없이 넌센스 결과를 제공하는 대신 단순히 display ()를 호출하도록 다시 구현되어야합니다. 이 질문을 한 사람은 지금까지 사용했던 다른 모든 객체에 의해 설정된 R에 대한 사용자 모델을 깨뜨린 코드로 넘어졌습니다. 끔찍한 프로그래밍 연습입니다.

— Bogdanovist

많은 감사합니다, atiretoo. 이것은 또 다른 질문을 제기합니다. display ()와 summary ()의 차이점은 무엇입니까? 전자의 출력은 두 번째 열보다 적은 두 열의 출력이며 2 자리로 반올림 된 것 같습니다. Gelman의 게시물에서 위의 링크와 같이 표시됩니다.

— user3671

예, Andrew Gelman의 블로그에서 논의한 내용에 따르면 향후 버전의 arm 패키지에서이 문제를 해결할 것 같습니다.

— atiretoo-복원 monica