나는 차별 사건에 대한 경험에서 이것을 역 엔지니어링 할 것입니다. "741에서 1" 등 의 값이 어디에서 왔는지 확실히 알 수 있습니다 . 그러나 번역에서 많은 정보가 손실되어 나머지 재건 작업은 사람들이 법정 환경에서 통계를 수행하는 방법을 보았을 때 의존합니다. 나는 세부 사항 중 일부만 추측 할 수 있습니다.
1960 년대 (제목 VI)에 차별 금지법이 통과 된 이후 미국 법원은 p- 값을보고이를 임계 값 와 0.01 과 비교하는 법을 배웠습니다 . 또한 일반적으로 "표준 편차"라고하는 표준화 된 효과를보고이를 "2 ~ 3 개의 표준 편차"의 임계 값과 비교하는 방법을 배웠습니다. 확립하기 위해 프리마 일견의 차별 소송에 대한 경우, 원고는 일반적으로 이러한 임계 값을 초과하는 "서로 다른 영향을"보여주는 통계 계산을 시도합니다. 이러한 계산을 지원할 수없는 경우 일반적으로 진행할 수 없습니다.0.050.01
원고의 통계 전문가는 종종이 익숙한 용어로 결과를 표현하려고 시도합니다. 일부 전문가들은 고용 결정이 순전히 무작위 적이며 직원의 다른 특성에 의해 중단되었다고 가정 할 때 귀무 가설이 "역효과 없음"을 나타내는 통계 테스트를 수행합니다. (단일 또는 양측의 대안이 전문가와 환경에 따라 다를 수 있습니다.) 그런 다음이 검정의 p- 값을 표준 정규 분포를 참조하여 여러 "표준 편차"로 변환합니다. - 표준 표준이 원래 테스트와 관련이없는 경우에도 마찬가지입니다. 이 로터리 방식으로 그들은 결론을 판사에게 명확하게 전달하기를 희망합니다.
우발 사태 표에 요약 될 수있는 선호되는 데이터 테스트는 Fisher 's Exact Test입니다. 이름에서 "정확한"의 발생은 특히 원고에게 유쾌합니다. 왜냐하면 오류없이 이루어진 통계적 결정을 의미하기 때문 입니다.
여기에 노동부의 계산에 대한 나의 (추론 적 재구성)이 있습니다.
그들은 Fisher 's Exact Test 또는 이와 유사한 것을 실행했습니다 (예 : 무작위 화를 통해 결정된 p- 값 을 갖는 테스트). 이 테스트에서는 Matthew Gunn의 답변에 설명 된대로 초기 하 분포를 가정합니다. (이 불만에 관련된 소수의 사람들의 경우, 초기 하 분포는 정규 분포에 의해 근사치가 아닙니다.)χ2
그들은 p- 값을 정규 Z 점수 ( "표준 편차 수")로 변환했습니다.
그들은 Z 점수를 가장 가까운 정수로 반올림 했습니다. "3 표준 편차 초과", "5 표준 편차 초과"및 "6 표준 편차 초과" (이 Z-점수 중 일부는 반올림 때문에 최대 보다 표준 편차로를, 나는이 "초과"정당화 할 수없는, 내가 할 수있는 그것을 인용입니다.)
불만 사항에서 이러한 통합 Z 점수는 다시 p- 값으로 변환되었습니다! 다시 표준 정규 분포가 사용되었습니다.
이러한 p- 값은 "이 결과가 우연히 발생했을 가능성"으로 설명되어 있습니다 (오해의 소지가있는 방식으로).
이 추론을 뒷받침하기 위해 세 경우의 Fisher 's Exact Test의 p- 값은 약 , 및 입니다. 이들은 풀의 가정에 근거 , , 및 "이상"에 대응하는 , 및 , 각각. 이 수치는 정상 Z 점수가 , 및 둥근 세, 다섯, 여섯 표준 편차, 불만에 나타나는 정확하게 숫자를 각각,,. (단일) 정규 p- 값에1 / 56만5천 1 / 58,000,000 730 1,160 130 730 1,160 130 - 3.16 - 4.64 - 5.52 1 / 741 1 / 3,500,000 1 / 1,000,000,0001/12801/5650001/5800000073011601307301160130−3.16− 4.64− 5.521 / 741, 및 : 정확하게 값은 불만에서 인용.1 / 35000001 / 1000000000
다음은 R
이러한 계산을 수행하는 데 사용되는 코드입니다.
f <- function(total, percent.asian, hired.asian, hired.non.asian) {
asian <- round(percent.asian/100 * total)
non.asian <- total-asian
x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
nrow = 2,
dimnames=list(Race=c("Asian", "non-Asian"),
Status=c("Not hired", "Hired")))
s <- fisher.test(x)
s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))