2014-01-15 업데이트
나는 간접적으로 조정 된 비율 장애인에 대한 오류 마진이 ACS에서 동일한 비율에 대한 오류 마진보다 크거나 작은 지에 대한 Danica의 원래 질문에 대답하지 않았다는 것을 알고 있습니다. 답은 회사 범주 비율이 주 ACS 비율과 크게 다르지 않은 경우 아래 주어진 오류 마진은 ACS 오류 마진보다 작습니다. 이유 : 간접 비율은 조직 작업 범주 개인 수 (또는 상대 비율)를 고정 된 숫자로 취급합니다. 비활성화 된 비율의 ACS 추정에는 사실상 해당 비율 의 추정 이 필요하며 이를 반영하기 위해 오차 한계가 증가합니다.
설명하기 위해 비활성화 비율을 다음과 같이 작성하십시오.
피^a d제이= ∑ n나는엔피나는^
여기서 는 ACS의 범주 에서 예상 비활성화 된 비율입니다 .I피^나는나는
반면에 ACS 추정 속도는 사실상 다음과 같습니다.
피^C 의= ∑ ( N나는엔)ˆ피나는^
여기서 및 은 각각 모집단 범주 및 전체 합계이고 은 범주 의 모집단 비율입니다 . N N i / N i엔나는엔엔나는/ N나는
따라서 외에도 을 추정해야하기 때문에 ACS 속도에 대한 표준 오차가 더 커집니다 .p i엔나는/ N피나는
조직 범주 비율과 인구 추정 비율이 크게 다르면 있습니다. 내가 구성한 두 범주의 예에서 범주는 및 비율로 표시되었습니다 . 비활성화 된 예상 비율의 표준 오류는 입니다.N (1) / N이 = 0.7345 N 2 / N이 = 0.2655 S E ( P는 C 들 ) = 0.0677을에스이자형( P^a d제이) > S이자형( P^C 의)엔1/ N= 0.7345엔2/ N= 0.2655에스이자형( P^C 의) = 0.0677
0.7345 및 0.2655를 고정 값 및 (간접 조정 방식)으로 간주하면 로 훨씬 작습니다. 아닌 경우, 과 , 동일한 빈도로, 극한의시 및 , 입니다. 조직과 인구 범주 비율이 크게 다른 경우 놀랍습니다. 그렇지 않다면 ACS 오류 마진을 보수적, 아마도 매우 보수적 인 실제 오류 마진의 추정치로 사용하는 것이 안전하다고 생각합니다.엔1/ n엔2/ n에스이자형( P^a d제이) = 0.0375엔1/ n=0.15엔2/ n=0.85에스이자형( P^a d제이) = 0.0678에스이자형( P^C 의)엔1/ n=0.001S E ( P 차원 j는 ) = 0.079엔2/ n=0.999에스이자형( P^a d제이) = 0.079
2014-01-14 업데이트
짧은 답변
제 생각에는 CI 또는 오류 마진 (CI 길이의 절반)이없는 통계를 제시하는 것은 무책임합니다. 이를 계산하려면 ACS PUMS (Public Use Microdata Sample) ( http://www.census.gov/acs/www/data_documentation/public_use_microdata_sample/ ) 를 다운로드하여 분석해야합니다 .
긴 대답
이것은 실제로 ACS의 가중치가 아닙니다. 역학의 표준 절차 인 Google의 간접 표준화 버전입니다 (Google 또는 모든 에피 텍스트 참조). 이 경우 주 ACS 작업 (범주) 장애 비율은 조직 작업 범주 직원 수에 따라 가중됩니다. 이것은 조직의 예상 장애인 수를 계산하며 E
관찰 된 수와 비교할 수 있습니다 O
. 비교를위한 일반적인 측정 기준은 표준화 된 비율 R= (O/E)
입니다. (일반적인 용어는 "표준 사망률"의 "SMR"이지만 여기서 "결과"는 장애입니다. R
또한 관찰 된 장애 비율 (O/n)
과 간접적으로 표준화 된 비율의 비율 (E/n)
이며 n
조직의 직원 수는 어디 입니까?
이 경우 CI 만 필요 E
하거나 E/n
필요한 것으로 보이 므로 먼저 시작하겠습니다.
만약
n_i = the organization employee count in job category i
p_i = disability rate for job category i in the ACS
그때
E = sum (n_i p_i)
차이 E
는 다음과 같습니다.
var(E) = nn' V nn
여기서 nn
조직 범주 개수의 열 벡터 V
는 ACS 범주 장애율의 추정 분산 공분산 행렬입니다.
또한, 사소하게, se(E) = sqrt(var(E))
그리고 se(E/n) = se(E)/n
.
E의 90 % CI는
E ± 1.645 SE(E)
나누기는 n
대한 CI를 얻을 수 있습니다 E/n
.
추정하려면 var(E)
ACS PUMS (Public Use Microdata Sample) 데이터 ( http://www.census.gov/acs/www/data_documentation/public_use_microdata_sample/ ) 를 다운로드하고 분석해야합니다 .
var(E)
Stata의 컴퓨팅 프로세스에 대해서만 말할 수 있습니다 . 사용 가능한지 모르겠으므로 세부 정보를 연기하겠습니다. 그러나 R 또는 (아마도) SAS의 조사 기능에 대해 잘 알고있는 사람은 위의 방정식에서 나온 코드를 제공 할 수도 있습니다.
비율에 대한 신뢰 구간 R
의 신뢰 구간 R
은 일반적으로에 대한 포아송 가정을 기반으로 O
하지만이 가정은 틀릴 수 있습니다.
우리는 독립적으로 생각 O
하고 고려할 수 있습니다.E
log R = log(O) - log(E) ->
var(log R) = var(log O) + var(log(E))
var(log(E))
의 계산 후 하나 이상의 Stata 단계로 계산할 수 있습니다 var(E)
.
푸 아송 독립성 가정에서 :
var(log O) ~ 1/E(O).
Stata와 같은 프로그램은 음의 이항 모델 또는 일반화 된 선형 모델에 적합하고보다 정확한 분산 항을 제공 할 수 있습니다.
에 대한 대략 90 % CI log R
는
log R ± 1.645 sqrt(var(log R))
에 대한 CI를 얻기 위해 끝점을 지수화 할 수 있습니다 R
.