베이지안 로짓 모형-직관적 인 설명?


11

저의 학급, 학부 또는 대학원에서 그 용어에 대해 들어 보지 못했다고 고백해야합니다.

로지스틱 회귀 분석이 베이지안이라는 것은 무엇을 의미합니까? 다음과 비슷한 정규 물류에서 베이지안 물류로의 전환에 대한 설명을 찾고 있습니다.

이것은 선형 회귀 모델의 방정식입니다 : .E(y)=β0+β1x1+...+βnxn

이것은 로지스틱 회귀 모델 식이다 : . 이것은 y가 범주 형일 때 수행됩니다.ln(E(y)1E(y))=β0+β1x1+...+βnxn

우리가 한 일은 를 입니다.E(y)ln(E(y)1E(y))

그렇다면 베이지안 로지스틱 회귀 분석에서 로지스틱 회귀 모델은 어떻게됩니까? 나는 그것이 방정식과 관련이 없다고 생각합니다.

책 미리보기 가 정의 된 것 같지만 실제로 이해가되지 않습니다. 이 모든 것, 가능성이 무엇입니까? 는 무엇입니까 ? 누군가 책이나 베이 즈 로짓 모델의 다른 부분을 다른 방식으로 설명해 주시겠습니까?α

참고 : 이것은 이전요청 되었지만 잘 대답하지 못했습니다.


1
@Tim이 대부분 덮여 있다고 생각하기 때문에 이것을 대답에 넣고 싶지 않습니다. 베이지안 로지스틱 회귀 분석과 베이지안 일반화 선형 모형 (GLM)에서보다 일반적으로, 사전 분포는 계수뿐만 아니라 해당 계수의 분산 및 공분산에 대해서도 배분된다는 점이 유일하게 큰 대답에서 누락 된 것입니다. GLM에 대한 베이지안 접근법의 주요 장점 중 하나는 계수의 공분산을 위해 복잡한 모형을 지정하고 복잡한 모형을 적합시키는 경우가 많기 때문에 언급하기가 매우 중요합니다.
충돌 평형

2
@BrashEquilibrium : 로짓 모델에 대한 표준 베이지안 모델링의 가능한 계층 적 확장을 언급하고 있습니다. 에서는 우리 책 , 우리는 인스턴스를 사용하여 A-g 이전에 공분산 행렬 공변량로부터 유도되는 수정 이전의, . XβX
Xi'an

1
g에 대해 충분히 공정하다.
Brash Equilibrium

1
즉, 공분산에는 여전히 선행이 있습니다 !!!!!! 논의하지 않으면 로지스틱 회귀가 어떻게 작동하는지 설명하지 않은 것입니다.
Brash Equilibrium

답변:


19

로지스틱 회귀는 선형 조합으로 설명 할 수 있습니다.

η=β0+β1X1+...+βkXk

링크 함수 통해 전달됩니다 .g

g(E(Y))=η

여기서 링크 함수는 로짓 함수입니다.

E(Y|X,β)=p=logit1(η)

여기서 는 값만 취하고 역 로짓 함수는 선형 조합 를이 범위로 변환 합니다. 이것은 고전적인 로지스틱 회귀가 끝나는 곳입니다.{ 0 , 1 } ηY{0,1}η

당신은 리콜 그러나 경우 에서만 값을 변수 ,보다 로 간주 할 수 . 이 경우 로짓 함수 출력은 "성공"의 조건부 확률, 즉 로 간주 될 수 있습니다 . Bernoulli 분포 는 일부 매개 변수 를 사용하여 이진 결과를 관찰 할 확률을 나타내는 분포 이므로 과 같이 설명 할 수 있습니다.E(Y)=P(Y=1){0,1}E(Y|X,β)P(Y=1|X,β)P(Y=1|X,β)pY

yiBernoulli(p)

로지스틱 회귀 분석을 통해 독립 변수 가진 togeder가 선형 조합 형성하는 일부 매개 변수 를 찾습니다 . 고전적 회귀에서는 (링크 함수를 항등 함수로 가정) 에서 값을 취하는 모델 대해 를 적합하도록 변환해야합니다. 의 의 범위.X η E ( Y | X , β ) = η Y { 0 , 1 } η [ 0 , 1 ]βXηE(Y|X,β)=ηY{0,1}η[0,1]

이제 베이지 안에서 로지스틱 회귀를 추정하려면 선형 회귀와 마찬가지로 매개 변수에 대한 몇 가지 선행 사항을 선택한 다음 ( Kruschke et al, 2012 참조 ) logit 함수를 사용하여 선형 조합 를 변환하여 출력을 변수 를 설명하는 Bernoulli 분포의 모수 . 예, 실제로 방정식과 로짓 연결 함수를 자주 사용하는 경우와 같은 방식으로 사용하고 나머지는 (예 : 선회 회귀 추정 베이지안 방식과 같은) 사전 작업을 선택합니다. η p YβiηpY

사전을 선택하는 간단한 방법 은 사전 설정되거나 취해진 매개 변수 및 와 함께 대해 정규 분포를 선택하는 것입니다 (그러나 보다 강력한 모형의 경우 또는 Laplace 분포 와 같은 다른 분포를 사용할 수도 있음 ). 에서 계층 전과 . 이제 모델 정의를 사용하면 JAGS 와 같은 소프트웨어를 사용 하여 Markov Chain Monte Carlo 시뮬레이션 을 수행 하여 모델을 추정 할 수 있습니다. 아래에는 간단한 물류 모델에 대한 JAGS 코드가 게시되어 있습니다 ( 자세한 예제는 여기 참조).β i μ i σ 2 itβiμiσi2

model {
   # setting up priors
   a ~ dnorm(0, .0001)
   b ~ dnorm(0, .0001)

   for (i in 1:N) {
      # passing the linear combination through logit function
      logit(p[i]) <- a + b * x[i]

      # likelihood function
      y[i] ~ dbern(p[i])
   }
}

보시다시피 코드는 모델 정의로 직접 변환됩니다. 어떤 소프트웨어가 수행하는 것이 보통 전과에서 일부 값을 그립니다 a하고 b, 다음은 추정이 값을 사용하여 p마지막으로, 데이터는 이러한 매개 변수를 주어진 가능성을 평가하는 우도 함수를 사용하여 (이것은 당신이 베이 즈 정리를 사용할 때 볼 수 있습니다 여기 에 더 자세한 설명).

기본 로지스틱 회귀 모델은 계층 모델 ( hyperpriors 포함 )을 사용하여 예측 변수 간의 종속성을 모델링하도록 확장 될 수 있습니다 . 이 경우 독립 변수 사이의 공분산 에 대한 정보를 포함시킬 수있는 다변량 정규 분포 에서 그릴 수 있습니다βiΣ

(β0β1βk)MVN([μ0μ1μk],[σ02σ0,1σ0,kσ1,0σ12σ1,kσk,0σk,1σk2])

...하지만 자세한 내용은 여기로 넘어가겠습니다.

여기에있는 "베이지 아"부분은 베이 즈 정리를 사용하고 확률론적인 용어로 모형을 정의하는 것입니다. "베이지안 모델"의 정의는 여기를 참조 하고 베이지안 접근에 대한 일반적인 직관 은 여기를 참조하십시오 . 또한이 방법을 사용하면 모델을 정의하는 것이 매우 간단하고 유연합니다.


Kruschke, JK, Aguinis, H. & Joo, H. (2012). 조직 과학의 데이터 분석을위한 베이지안 방법. 조직 연구 방법, 15 (4), 722-752.

Gelman, A., Jakulin, A., Pittau, GM 및 Su, Y.-S. (2008). 로지스틱 및 기타 회귀 모델에 대한 약한 유익한 기본 사전 배포입니다. 응용 통계의 연대기, 2 (4), 1360–1383.


1
계수뿐만 아니라 분산에 대한 증거가 필요합니다.
Brash Equilibrium

3
@BCLC no, 로지스틱 회귀로 짓은 로짓 함수 로 사용되는 반면, 는 선형 조합 . 예를 들어 선형 회귀 는 항등 함수이므로 . GLM 의 표준 사양 일뿐 입니다. gηη=β0+β1X1gE(Y)=η

1
@BCLC는 내 답변의 링크를 확인하고 일반적으로 베이지안 통계를 소개합니다. 이것은 초기 질문에서 언급 한 것보다 훨씬 광범위한 주제이지만 내 대답에서 제공 한 참고 문헌에서 멋진 소개를 찾을 수 있습니다.

1
@Tim 나는 거기에 오타를 만들었습니다. 증거는 사전을 읽어야합니다. 기본적으로 계수는 알려지지 않은 유일한 매개 변수가 아닙니다. 다항 분포에는 분산 공분산 행렬이 있으며 일반적으로 알려진 것으로 가정하지 않습니다.
Brash Equilibrium

3
"여기의"베이지 아 "부분은 베이 즈 정리를 사용하여 확률 론적 용어로 모형을 정의하는 것입니다." 여기서 좋은 참조는 Gelman et al. 물류 및 기타 회귀 모형에 대한 약하게 관련 정보 제공의 DEFAULT 사전 분포 stat.columbia.edu/~gelman/research/published/priors11.pdf
달튼 Hance

6

이 모든 것, 가능성이 무엇입니까?

그것이 베이지안을 만드는 이유입니다. 데이터의 생성 모델은 동일합니다. 차이점은 베이지안 분석 에서 관심 모수에 대한 일부 사전 분포를 선택하고 모든 추론이 기반으로 하는 사후 분포를 계산하거나 근사한다는 것입니다. 베이 즈 규칙은 두 가지를 연관시킵니다. 후부는 이전의 가능성 시간에 비례합니다.

직관적으로,이 사전은 분석가가 주제 전문 지식이나 기존 결과를 수학적으로 표현할 수있게합니다. 예를 들어, 참조하는 텍스트는 의 이전 은 다변량 법선입니다. 아마도 선행 연구는 특정 정상 매개 변수로 표현할 수있는 특정 범위의 매개 변수를 제안합니다. (유연성에 책임이있다 : 회의론자에 앞서 그들의 정당성을 정당화 할 수 있어야한다.)보다 정교한 모델에서는 도메인 전문 지식을 사용하여 특정 잠재 매개 변수를 조정할 수있다. 예를 들어이 답변 에서 참조 된 간 예제를 참조하십시오 .β

일부 잦은 모델은 특정 이전의 베이지안 모델과 관련이있을 수 있지만,이 경우에 해당하는지 확실하지 않습니다.


SeanEaster, 'prior'는 가정 된 분포에 사용되는 단어입니까? 예를 들어 우리는 X 또는 가정합니다 ( 과 같이 를 의미하는 경우 대신 , , ..., 합니까? 의 분포는 ...?) 정상 이라고 생각 하지만 다른 분포에 맞추려고합니까? '근사치'란 정확히 무엇을 의미합니까? ' β β 1 , β 2 , . . , β n X 1 X 2 X n ββββ1,β2,...,βnX1X2Xnβ
맞춤

1
@BCLC이 질문에 답하기 위해 Bayesian 추론의 맨 처음 프로세스부터 시작하여 용어를 정의하겠습니다. Bayesians 는 관심있는 모든 매개 변수를 임의의 변수로 취급 하고 데이터에 비추어 이러한 매개 변수에 대한 신념을 업데이트합니다. 사전 분포는 데이터를 분석하기 전에 매개 변수에 대한 자신의 신념을 표현; 사전 및 가능성의 정규화 된 곱인 베이 즈 규칙에 의한 * 전후 분포 *는 이전 및 데이터에 비추어 매개 변수에 대한 불확실한 신념을 요약합니다. 후부를 계산하는 것은 피팅이 이루어지는 곳입니다.
Sean Easter

1
@BCLC 따라서 매개 변수에 분포가있는 이유는 무엇입니까? 다른-일반적으로 간단한 베이 즈 모델에서, 후 분포는 닫힌 형태 표현을 가질 수 있습니다. (베타 이전에 함께 베르누이 랜덤 변수 의 후방 . 예를 들어 베타 분포된다)하지만 포스 테리어를 분석적으로 표현 될 수없는 경우에, 우리는 대략 일반적 MCMC 방법을 사용하여, 그들을. p pβpp
Sean Easter

좋아, 나는 교리의 문제를 해결하기위한 에세이를 읽은 후에 당신을 더 잘 이해한다고 생각한다 . 감사합니다 SeanEster
BCLC

1
네. 많은 경우에, 는 분석적으로 계산하는 것이 불가능할 것입니다. P(B)
Sean Easter
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.