Monte Carlo 시뮬레이션 추정의 정밀도 찾기


12

배경

나는 일련의 모델의 출력을 결합한 Monte Carlo 시뮬레이션을 설계하고 있으며 시뮬레이션을 통해 시뮬레이션 결과의 확률과 확률 추정의 정확성에 대한 합리적인 주장을 할 수 있기를 바랍니다.

시뮬레이션은 특정 커뮤니티에서 배심원이 특정 피고에게 유죄 판결을받을 가능성을 발견 할 것입니다. 시뮬레이션 단계는 다음과 같습니다.

  1. 기존 데이터를 사용하여 인구 통계 학적 예측 변수에 대한“주최자 우선 투표 투표”를 회귀 하여 로지스틱 확률 모델 ( M )을 생성합니다 .

  2. Monte Carlo 방법을 사용하여 1,000 버전의 M (즉, 모델 매개 변수에 대한 1000 버전의 계수) 을 시뮬레이션하십시오 .

  3. 모델의 1,000 버전 ( M i ) 중 하나를 선택하십시오 .

  4. 지정된 인구 통계 학적 특성 분포를 가진 개인 의 "커뮤니티"( C ) 에서 12 명의 "주니어"1,000 세트를 무작위로 선택하여 1,000 심사

  5. M i를 사용하여 각 배심원에 대한 첫 번째 유죄 투표권 확률을 결정적으로 계산하십시오 .

  6. 각 "심사원"의 가능한 투표를 결정된 투표로 렌더합니다 (0-1 사이에서 무작위로 선택된 값보다 큰지 아닌지에 따라).

  7. 첫 번째 투표에서 유죄 판결을 내리는 배심원의 비율에 따라 배심원이 유죄 판결을 내릴 확률의 모델 (실증적 데이터에서 도출)을 사용하여 각 "심사원" "최종 투표"를 결정합니다.

  8. 1000 배심원에 대한 유죄 평결의 비율을 저장하십시오 ( PG i ).

  9. 1,000 개의 시뮬레이션 된 M 버전 각각에 대해 3-8 단계를 반복하십시오 .

  10. PG 의 평균값을 계산하고 C 에서 유죄 판결 확률의 포인트 추정치로보고하십시오  .

  11. PG에 대한 2.5 및 97.5 백분위 수 값을 식별하고 0.95 신뢰 구간으로보고하십시오.

저는 현재 확률 분포 ( C의 인구 통계적 특성 또는 M 버전) 에서 1,000 개의 무작위 추첨이 해당 분포를 채울 것이라는 이론에 따라 1,000 명의 배심원과 1,000 명의 배심원을 사용하고 있습니다.

질문

이를 통해 견적의 정확성을 정확하게 결정할 수 있습니까? 그렇다면 C 의 확률 분포 를 다루기 위해 각 PG i 계산 에 대해 배심원이 몇 명이나 있어야합니까 (따라서 선택 편견을 피하십시오). 1,000 미만을 사용할 수 있습니까?

도움을 주셔서 대단히 감사합니다!


그냥 호기심에서 :이 모델에서 피고인이 실제로 유죄 인지 여부에 대한 조건부 입니까?
whuber

이 모델은 단일 사실 패턴에 대한 설문 조사 응답을 기반으로하므로 실제 죄책감은 변하지 않습니다. 하나의 이의 제기 사건에서 다른 배심원이 어떻게 나올지 예측하고 있습니다.
매기

농담으로, PG의 평균 및 2.5 및 97.5 백분위 수의 세 가지 추정치를보고합니다. "정확한"결정이 필요한 것은 어느 정도이며 얼마나 정확해야합니까?
whuber

또한 단계 (6)은 신비합니다. 의도 한 것을 설명해 주시겠습니까? 각 배심원 (5), 각 배심원 (4), 각 모델 (3) 또는 이들의 조합에 대해 서로 다른 "임의로 선택된 값"이 있습니까?
whuber

1
(위의 의견 참조) 배심원 수를 (a) 줄일 수 있다고 생각합니다. 샘플링 오류는 샘플 수의 함수입니다. 모델 당 1,000 명의 심사 위원으로 총 백만 개의 샘플이 있습니다. 10 ^ 6 샘플과 관련된 샘플링 오류는 ~ 0.1 %입니다. 모델 당 35 개의 배심원 만 사용하면 3.5 * 10 ^ 4 개의 샘플과 ~ 0.5 %의 샘플링 오류가 발생합니다. 이 샘플링 오류는 측정 오차 ~ 5.0 %보다 훨씬 작습니다. 따라서 모델 당 35 개의 심사 위원을 사용하고 측정 오차를 사용하여 신뢰 구간을 추정 할 수 있어야합니다.
Maggie

답변:


4

Monte Carlo의 우수성에 대한 하나의 일반적인 "우주"기준이 있습니다.

하나의 M을 고수하고 PG가 배심원 수와 어떻게 동작하는지 확인하십시오-수렴해야하므로 합리적인 (응용 프로그램에 대해) 유효 숫자의 숫자를 가질 수있는 많은 반복이 표시됩니다. 다른 Ms에 대해서도이 벤치 마크를 반복하여 M 선택에 운이 없는지 확인한 다음 전체 시뮬레이션을 진행하십시오.


1
아무도 질문에 완전히 반응했는지 확실하지 않습니다. (1) 설명 된 모델링 전략은 해결하고자하는 문제에 대한 방어 적 해결책을 제공합니까? 즉, 특정 인구 통계 학적 특성을 가진 커뮤니티 C 에서 무작위로 배심원이 추첨 할 가능성은 무엇입니까? 피고인 유죄? 그리고 (2) 모델링 전략이 합리적이라면, 얼마나 많은“배심원”을 선택해야하는지, 그리고 각각에 대해 얼마나 많은“판결”을 시뮬레이션해야합니까? 그녀는 컴퓨팅 경제를 원합니다. 그녀의 마지막 코멘트를보십시오
dmk38

0

여기서 문제는 몬테 카를로 시뮬레이션을 사용하지 않고 모델이 너무 복잡해 보이는지 여부입니다.

모델이 모두 비교적 단순하면 모델을 여러 번 다시 실행하지 않고도 conventioanl 통계를 통해 모델을보고 질문에 대한 솔루션을 도출 할 수 있어야합니다. 이것은 약간의 단순화이지만, 모든 모델이 정규 분포를 기반으로 점을 생성하는 경우 원하는 답을 쉽게 도출 할 수 있습니다. 물론, 모형이이 모델이라면 Monte Carlo 시뮬레이션을 수행 할 필요가 없습니다.

문제가 복잡하고 더 기본적인 것으로 분해 할 수 없다면 Monte-Carlo가 올바른 모델 유형이지만 모델을 실행하지 않고 신뢰 한계를 정의하는 방법은 없다고 생각합니다. 결국 설명 된 신뢰 한계 유형을 얻으려면 모형이 여러 번 실행되어야하고 확률 분포는 결과에 적합해야하고 거기에서 신뢰 한계를 정의 할 수 있습니다. Monte-Carlo 시뮬레이션의 문제점 중 하나는 모델이 중간 범위의 분포에 대해 우수하고 정기적 인 답변을 제공하지만 꼬리는 종종 훨씬 더 가변적 인 결과를 제공하므로 결과적으로 2.5 %에서 출력의 모양을 정의하기 위해 더 많은 런을 의미합니다. 97.5 % 백분위 수.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.