인구는 질병에 걸릴 위험이있는 모든 사람들의 (가설적인) 세트입니다. 일반적으로 연구 영역에 거주하는 모든 사람 (또는 명확하게 식별 가능한 일부 하위 그룹)으로 구성됩니다. 이 모집단은 연구의 목표와 데이터에서 얻은 모든 추론의 대상이므로 명확하게 정의하는 것이 중요합니다.
질병의 사례가 독립적 인 경우 (병원이 사람간에 쉽게 전달되지 않고 지역 환경 조건에 의해 유발되지 않을 경우 합리적인 가설 일 수 있음) 드문 경우, 그 수는 포아송 분포를 밀접하게 따라야합니다 . 이 분포 의 표준 편차에 대한 올바른 추정값은 개수의 제곱근입니다 .
( 180 , 90 , 45 , 210 )( 13.4 , 9.5 , 6.7 , 14.5 )한 시즌 동안 관찰 된 실제 질병 수는 실제 비율과 다릅니다. 실제 (알 수 없음) 비율의 제곱근은 발생할 수있는 변동량을 정량화합니다. 때문에 관찰 카운트 한다고 가까운 실제 비율에 의한 것으로, 자신의 제곱근은 진정한 속도의 제곱근에 대한 합리적인 프록시해야한다. 이 프록시는 정확히 "표준 오류"가 의미하는 것입니다.
1657714.577
9( 20 , 10 , 5 , 23 )( 4.5 , 3.2 , 2.2 , 4.8 )9( 40 , 28.5 , 20 , 44 )
이 제한된 데이터로 갈 수있는 한도입니다. 이 간단한 계산 결과는 다음과 같습니다.
인구 특성을 결정하는 것이 중요합니다.
카운트의 제곱근은 표준 오차를 평가하기위한 대략적인 시작점입니다.
제곱근은 질병 사례에서 독립성이 결여되어 있음을 반영하기 위해 (대략) 몇 가지 요소를 곱해야합니다 (이 요소는 대략 질병 군집의 크기와 관련 될 수 있음).
이들 수의 변화는 주로 불확실성 (기초의 포아송 강도에 대한)보다는 시간에 따른 질병률의 변화를 반영합니다.