배경
나는 일련의 모델의 출력을 결합한 Monte Carlo 시뮬레이션을 설계하고 있으며 시뮬레이션을 통해 시뮬레이션 결과의 확률과 확률 추정의 정확성에 대한 합리적인 주장을 할 수 있기를 바랍니다.
시뮬레이션은 특정 커뮤니티에서 배심원이 특정 피고에게 유죄 판결을받을 가능성을 발견 할 것입니다. 시뮬레이션 단계는 다음과 같습니다.
기존 데이터를 사용하여 인구 통계 학적 예측 변수에 대한“주최자 우선 투표 투표”를 회귀 하여 로지스틱 확률 모델 ( M )을 생성합니다 .
Monte Carlo 방법을 사용하여 1,000 버전의 M (즉, 모델 매개 변수에 대한 1000 버전의 계수) 을 시뮬레이션하십시오 .
모델의 1,000 버전 ( M i ) 중 하나를 선택하십시오 .
지정된 인구 통계 학적 특성 분포를 가진 개인 의 "커뮤니티"( C ) 에서 12 명의 "주니어"1,000 세트를 무작위로 선택하여 1,000 심사
M i를 사용하여 각 배심원에 대한 첫 번째 유죄 투표권 확률을 결정적으로 계산하십시오 .
각 "심사원"의 가능한 투표를 결정된 투표로 렌더합니다 (0-1 사이에서 무작위로 선택된 값보다 큰지 아닌지에 따라).
첫 번째 투표에서 유죄 판결을 내리는 배심원의 비율에 따라 배심원이 유죄 판결을 내릴 확률의 모델 (실증적 데이터에서 도출)을 사용하여 각 "심사원" "최종 투표"를 결정합니다.
1000 배심원에 대한 유죄 평결의 비율을 저장하십시오 ( PG i ).
1,000 개의 시뮬레이션 된 M 버전 각각에 대해 3-8 단계를 반복하십시오 .
PG 의 평균값을 계산하고 C 에서 유죄 판결 확률의 포인트 추정치로보고하십시오 .
PG에 대한 2.5 및 97.5 백분위 수 값을 식별하고 0.95 신뢰 구간으로보고하십시오.
저는 현재 확률 분포 ( C의 인구 통계적 특성 또는 M 버전) 에서 1,000 개의 무작위 추첨이 해당 분포를 채울 것이라는 이론에 따라 1,000 명의 배심원과 1,000 명의 배심원을 사용하고 있습니다.
질문
이를 통해 견적의 정확성을 정확하게 결정할 수 있습니까? 그렇다면 C 의 확률 분포 를 다루기 위해 각 PG i 계산 에 대해 배심원이 몇 명이나 있어야합니까 (따라서 선택 편견을 피하십시오). 1,000 미만을 사용할 수 있습니까?
도움을 주셔서 대단히 감사합니다!