베이지안 모델을 먼저 맞추고 약화되기 전에 괜찮습니까?


10

빈번한 통계를 수행 할 때 더 많은 데이터를 수집하기로 결정하기 전에 통계 테스트 결과를 보는 것과 같이 큰 목록이 없습니다. 나는 베이지안 통계와 관련된 방법론에 대해 유사한 no-nos 목록이 있는지, 특히 다음이 그 중 하나인지 궁금합니다.

나는 최근에 내가 적합했던 일부 모델에 대해 내 프로세스가 모델이 작동하는지 또는 터지는 지 확인하기 위해 정보를 제공하기 전에 먼저 모델을 맞추고 정보를 얻지 못하거나 약한 정보를 제공하기 위해 사전을 약화시키고 모델을 다시 장착하십시오.

이것에 대한 나의 동기는 실제로이 모델을 JAGS / Stan으로 작성하고 있다는 사실과 관련이 있으며, 제 생각에는 통계적인 것보다 프로그래밍 작업처럼 취급하고 있습니다. 따라서 첫 번째 실행을 수행하면서 유익한 사전 정보를 사용하여 신속하게 수렴하도록 리깅을 수행하여 필자가 작성한 모델에서 오류를 쉽게 포착 할 수 있습니다. 그런 다음 모델을 디버깅 한 후 정보가 없거나 약한 정보가있는 사전 모델로 다시 맞 춥니 다.

내 질문은이 과정에서 몇 가지 심각한 규칙을 어 기고 있는지 여부입니다. 예를 들어, 내 추론이 유효하고 연구자의 자유도를 이용하지 않으 려면 모델을 적용 하기 전에 특정 사전에 전념해야 합니까?


4
유머러스 한 옆으로 (나는 희망한다) 여기 내가 쓴 시가있다 . (예, 나는 그것이 송시하지 알고)
피터 Flom에

@PeterFlom, 오, 불길하다.
JoFrhwld

답변:


9

주관적인 베이지안은 의견이 맞지 않을 수도 있지만, 내 관점에서 볼 때 이전은 가능성과 같은 모델의 일부일뿐입니다. 모형 동작에 대한 반응으로 이전을 변경하는 것은 우도 함수를 변경하는 것보다 낫거나 나쁘지 않습니다 (예 : 다른 오차 분포 또는 다른 모델 공식 시도).

낚시 원정에 나가게되면 위험 할 수 있지만 대안이 더 나빠질 수 있습니다. 예를 들어, 언급 한 경우 모델이 폭파하고 무의미한 계수를 얻는 경우 선택의 여지가 많지 않고 다시 시도하십시오.

또한 낚시 원정의 위험을 어느 정도 최소화하기 위해 취할 수있는 조치가 있습니다.

  • 최종 분석에 사용할 사전 결정
  • 전체 절차에 대한 분석을 게시하거나 설명 할 때 선행
  • 시뮬레이션 데이터 및 / 또는 최종 분석을위한 데이터 보유로 최대한 많은 일을합니다. 그렇게하면 분석을 너무 많이 오염시키지 않습니다.

4

이전 데이터를 실험하고 현재 데이터에서 성능 측면에서 하나를 선택하면 더 이상 "이전"이 아닙니다. 그것은 경험적 베이 즈 분석에서와 같이 데이터에 의존 할뿐만 아니라보고자하는 것에 의존합니다 (더 나쁜 것). 결국 베이지안 도구를 사용하지만이를 베이지안 분석이라고 할 수는 없습니다.


1
OP를 이해하면서 그는 이전의 것을 사용하지 않고 결과를보고 다른 이전을 통해 더 나은 결과를 얻을 수 있다고 결정합니다. 그는 자신의 모델이 올바르게 코딩되었는지 확인하기 위해 인공을 사용하고 분석을 위해 실제 사전으로 전환합니다. 아마도 첫 번째 단계에서 합성 데이터를 사용한 다음 두 번째 단계에서 실제 이전 데이터와 실제 데이터 모두로 전환했다면 더 받아 들일 수 있습니까?
Wayne

3

이 경우에는 세 가지 이유로 괜찮습니다.

  1. 실제로는 결과에 따라 사전을 조정하지 않습니다. "XYZ 이전을 사용하고 수렴 률과 DIC 결과에 따라 ABC에 의해 이전을 수정합니다."와 같은 말을 한 경우, 아니요를 약속하고 있지만이 경우에는 당신이 정말로 그렇게하지 않는 것처럼 들립니다.

  2. 베이지안 맥락에서, 사전은 명백하다. 따라서 당신은 당신의 이전을 부적절하게 조정할 수 있지만, 그 이전의 이유를 질문 할 수있는 다른 사람들이 그 결과의 우선 순위를 항상 확인할 수 있습니다. 어쩌면 내가 순진한 것 같습니다. 왜냐하면 이전과 같은 것을 한 눈에 쉽게 볼 수 있고 누군가가 그것을 제안했기 때문에 "흠, 합리적으로 보입니다"라고 말하기는하지만 ...

  3. 나는 당신이하고있는 일은 Gelman (및 다른 사람들)의 조언과 관련하여 JAGS 모델을 하나씩 구성하고, 먼저 합성 데이터로 작업 한 다음 실제 데이터로 작업하여 사양 오류가 없도록합니다. . 그것은 종종 잦은 방법론의 한 요소가 아니며 실험적인 방법론이 아닙니다.

다시, 나는 여전히이 재료를 스스로 배우고있다.

추신 당신이 원래 "정보 적 우선 순위"로 빠르게 수렴하도록 조작한다고 말할 때, 실제로 문제에 의해 동기가 부여 된 실질적인 유익한 우선 순위, 또는 임의의 이유로 인해 후위를 강하게 밀어 붙여 "수렴의 속도를 높이기"는 사실을 의미합니까? "어떤 점으로? 그것이 첫 번째 경우라면 왜 이러한 동기 부여에서 벗어나고 있는가?


1

나는 이것이 베이지안 학교와 무관 한 것이라고 생각합니다. Jeffreys는 정보가없는 사전을 사용하려고합니다. Lindley는 유익한 정보를 사용하기를 원할 것입니다. 경험적인 베이지안은 데이터가 이전에 영향을 미치도록 요청할 것입니다. 그러나 각 학교는 이전의 선택에 대해 다른 제안을하고 있지만, 모든 학교는 당신이 원하는 결과를 얻을 때까지 사전을 가지고 계속 조정할 수 있다는 것을 의미하지는 않습니다. 그것은 당신이 대답이 무엇인지에 대한 당신의 선입견에 도달 할 때까지 데이터를보고 데이터를 수집하고 테스트하기 위해 계속하는 것과 같습니다.

상용 주의자 또는 베이지안은 중요하지 않습니다. 데이터를 사용하여 트릭을 (또는 마사지) 원하는 사람은 없다고 생각합니다. 어쩌면 이것은 우리 모두가 동의 할 수있는 일이며 피터의 재미있는시는 실제로 apropo입니다.


1

나는 아니오라고 말할 것입니다, 당신은 특정 사전에 헌신 할 필요가 없습니다. 일반적으로 베이지안 데이터 분석 중에는 이전 모델에 대한 모델의 민감도 분석을 수행해야합니다. 여기에는 결과에 어떤 일이 발생하는지 확인하기 위해 다양한 다른 사전을 시도하는 것이 포함됩니다. 이것은 사용하기 전에 더 좋거나 더 강력한 것으로 드러날 수 있습니다.

두 가지 명백한 "no-no 's"는 이전에 너무 많이 맞추면 더 잘 맞을 수 있으며, 너무 잘 맞고 모델의 다른 매개 변수가 더 잘 맞도록 변경됩니다. 첫 번째 예 : 평균에 대한 초기 사전을 변경하여 표본 평균에 더 가깝습니다. 두 번째로 : 회귀 분석에서 설명 변수 / 특성을 변경하여 더 잘 맞습니다. 이것은 모든 버전의 회귀 문제이며 기본적으로 자유도를 무효화합니다.


감도 분석에 대해 +1 당신은 당신의 결과가 사용 된 이전의 결과에 얼마나 의존하는지 알아야합니다.
Manoel Galdino
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.