배심원 선택의 편견?


14

배심원 선택이 인종적으로 편중 된 것으로 보이는 형사 재판 후 친구가 항소에 의뢰인을 대변하고 있습니다.

배심원 풀은 4 명의 인종 그룹에서 30 명으로 구성되었습니다. 검찰은 풀에서이 10 명을 제거하기 위해 선제 적 도전을 사용했다. 각 인종 그룹의 인원 수와 실제 과제 수는 각각 다음과 같습니다.

A: 10, 1
B: 10, 4
C:  6, 4
D:  4, 1
total: 30 in pool, 10 challenges

피고는 인종 C 그룹과 인종 A 및 D의 피해자들로부터 왔으므로 그룹 C가 어려움을 겪고 있고 그룹 A와 그룹 D가 어려움을 겪고 있는지 여부는 우선 순위 입니다. 법적으로 (IIUC; IANAL), 국방은 인종 편견 을 입증 할 필요는 없지만 , 데이터가 편견을 나타내는 것처럼 보이기 때문에 검찰이 각 인종 문제를 비 인종적으로 설명하는 부담을 가중시킵니다.

다음 분석은 접근 방식이 정확합니까? (계산은 괜찮다고 생각합니다.) :

nCr (30,10) = 30,045,015 개의 10 개의 풀 멤버가 있습니다. 이 별개의 세트들 중에서, 433,377 세트는 (그룹 A와 D의 2 명 이하의 조합) (그룹 C의 4 명 이상 )을 포함한다고 계산합니다 .

따라서 C 군에 비해 A 군과 D 군이 관측 된 수준의 명백한 편향 군에 도달 할 가능성은 10 군데에 포함되지 않은 선호 군이 433/30045 = 1.44 %입니다.

따라서 귀무 가설 (그러한 편견이 없음)은 5 % 유의 수준에서 기각됩니다.

이 분석이 방법 론적으로 정확하다면, 학문적 / 전문적 참고 자료 (즉, Wikipedia가 아닌)를 포함하여 법원에 분석하는 가장 간결한 방법은 무엇입니까? 주장은 단순 해 보이지만 어떻게 법원에 판결이 정확하고 간결하게 보여줄 수 있습니까?


업데이트 : 이 질문은 항소 요약에서 3 차 논쟁으로 고려되었습니다. 여기에서 논의의 기술적 복잡성 (변호사 관점에서)과 법적 선례의 명백한 부족을 감안할 때 변호사는 그것을 제기하지 않기로 선택했기 때문에이 시점에서 문제는 대부분 이론적 / 교육적입니다.

하나의 세부 사항에 대답하기 위해 : 저는 10 개의 도전 과제가 미리 설정되어 있다고 생각합니다.

사려 깊고 도전적인 답변과 의견 (고마워요!)을 연구 한 후에 여기에 4 가지 별도의 문제가있는 것 같습니다. 적어도 저에게는 그것들을 개별적으로 고려하는 것이 가장 도움이 될 것입니다 (또는 분리 할 수없는 이유에 대한 논쟁을 듣는 것).

1) 피고와 피해자 모두의 종족의 고려 사항은 법적 우려, 배심원 문제에서, 선험적 ? 항소 주장의 목적은 단지 합리적인 우려를 불러 일으키는 것이며, 검찰이 각 개인의 도전에 대한 이유를 진술하는 사 법적 명령으로 이어질 수 있습니다. 이것은 나에게 통계적 질문이 아닌 사회 / 법적 문제 인 것처럼 보이며 변호사의 재량에 따라 제기되거나 제기되지 않습니다.

2) (1)이라고 가정하면, 대안 가설 (질적으로 : 피고인의 인종을 공유하는 배심원에 대한 편견, 피해자의 인종을 공유하는 사람들을 선호하는)에 대한 편견이 그럴듯한가, 아니면 절대적으로 게시 할 수 없는가? 제 관점에서 볼 때, 이것은 가장 당혹스러운 질문입니다. 물론 관찰하지 않으면 질문을 제기하지 않을 것입니다! 내가 이해하는 바와 같이, 문제는 선택 편견이다 : 테스트는이 배심원 풀뿐만 아니라 방어가 불일치를 관찰하지 않았기 때문에 문제를 제기하려는 유혹을받지 않은 모든 배심원 풀의 우주를 고려해야한다. . 이 문제를 어떻게 해결합니까? (예를 들어, Andy의 테스트는이 문제를 어떻게 해결합니까?) 이것에 대해 내가 틀렸을 수도 있지만 대부분의 응답자들은 잠재적으로 사후에 문제를 일으키지 않습니다.피고인 그룹에 대한 편견에 대한 단측 테스트. 희생자 집단에 대한 편견을 동시에 시험하는 것이 방법 론적으로 어떻게 다른가? (1)

3) (2)에 명시된 바와 같이 질적 대안 가설의 선택을 규정한다면, 그것을 시험하기에 적절한 통계는 무엇인가? 내가 제안한 비율이 간단한 "바이어스 대 C"대립 가설에 대한 Andy의 검정과 약간 더 보수적 인 유사성 인 것처럼 보이기 때문에 여기에서 나는 가장 반응이 어려워진다. 정확히 관찰 된 횟수뿐만 아니라 꼬리에.)

두 검정은 모두 동일한 분모 (동일한 표본의 표본)와 각각의 대립 가설에 해당하는 표본의 빈도에 해당하는 분자를 사용한 간단한 계수 검정입니다. @whuber, 앤디의 계산 테스트에서 왜 "제한된 귀무 [동일한]와 [설명 된] 가설을 기반으로하고 네이 먼-피어슨 (Neyman-Pearson) 명예를 사용하여 정당화 될 수있다"는 사실이 동일하지 않은가?

4) (2)와 (3)에 규정 된 경우, 회의적인 항소 법원을 설득 할 수있는 법률이있는 경우에 대한 언급이 있습니까? 증거에서 현재까지는 아닐 수도 있습니다. 또한이 항소 단계에서는 "전문가 증인"에 대한 기회가 없으므로 참조가 모든 것입니다.


답변과 의견을 연구 한 후 질문이 업데이트되었습니다 (첨부).
JD 2009

훌륭한 요약 감사합니다! 포인트 (3)에 응답하기 위해, 내 관심사는 테스트 (올바르게 이해한다면)는 데이터 자체에 의해 유발 된 대체 가설을 채택한다는 것입니다. 따라서 결과를 가능한 한 강력하게 보이게하기 위해 후세 로 구성되어있는 것 같습니다 . 대체 가능한 가장 넓은 예측, 해당 클래스에 기초하는 시험 선험적 및 Neyman-피어슨 배제 영역으로 진행이 강한 논리적 기반이 있고이 역시 데이터를 본 후 제안되었다 비판 적게 될 것이다.
whuber

고마워, @whuber는 그럴듯하고 도움이되는 비판입니다. 그러나 그로 인해 내 (2)가 (3) 이전에도 실패하지 않습니까? 그렇다면, 나의 (3)은 여전히 ​​답이없는 것처럼 보일 것입니다. 즉, 만약 그것이 규정된다면 (2) 이것이 좋은 통계입니까?
JD 2009

답변:


7

다음은 표준 통계 도구를 사용하여 질문에 대답하는 방법입니다.

다음은 배심원의 그룹 멤버쉽이 거부 될 확률에 대한 프로 빗 분석 결과입니다 .

먼저, 데이터 모양은 다음과 같습니다. 그룹에 대한 30 가지 관찰과 이진 거부 표시기가 있습니다.

. tab group rejected 

           |       rejected
     group |         0          1 |     Total
-----------+----------------------+----------
         A |         9          1 |        10 
         B |         6          4 |        10 
         C |         2          4 |         6 
         D |         3          1 |         4 
-----------+----------------------+----------
     Total |        20         10 |        30 

공동 테스트뿐만 아니라 개별 한계 효과는 다음과 같습니다.

. qui probit rejected ib2.group

. margins rb2.group

Contrasts of adjusted predictions
Model VCE    : OIM

Expression   : Pr(rejected), predict()

------------------------------------------------
             |         df        chi2     P>chi2
-------------+----------------------------------
       group |
   (A vs B)  |          1        2.73     0.0986
   (C vs B)  |          1        1.17     0.2804
   (D vs B)  |          1        0.32     0.5731
      Joint  |          3        8.12     0.0436
------------------------------------------------

--------------------------------------------------------------
             |            Delta-method
             |   Contrast   Std. Err.     [95% Conf. Interval]
-------------+------------------------------------------------
       group |
   (A vs B)  |        -.3    .181659     -.6560451    .0560451
   (C vs B)  |   .2666667   .2470567     -.2175557     .750889
   (D vs B)  |       -.15   .2662236     -.6717886    .3717886
--------------------------------------------------------------

여기서 우리는 그룹 A에 비해 그룹 A, C 및 D에 대해 기각 될 확률의 차이가 0이라는 개별 가설을 테스트합니다. 모든 사람이 그룹 B만큼 거부 당했을 경우에는 0이됩니다. 마지막 결과물은 그룹 A 및 D 배심원이 기각 될 가능성이 적고 C 그룹 배심원이 기각 될 가능성이 더 높다는 것을 알려줍니다. 이러한 차이는 개별적으로 통계적으로 유의미하지 않지만 징후는 편향 추측과 일치합니다.

그러나 에서 세 가지 차이가 ​​모두 0이라는 공동 가설을 기각 할 수 있습니다 .=0.0436


추가:

희생자들의 인종을 공유 한 후 그룹 A와 그룹 D를 하나로 결합하면 프로 빗 결과가 더 강해지고 좋은 대칭을 갖게됩니다.

Contrasts of adjusted predictions
Model VCE    : OIM

Expression   : Pr(rejected), predict()

------------------------------------------------
             |         df        chi2     P>chi2
-------------+----------------------------------
      group2 |
 (A+D vs B)  |          1        2.02     0.1553
   (C vs B)  |          1        1.17     0.2804
      Joint  |          2        6.79     0.0336
------------------------------------------------

--------------------------------------------------------------
             |            Delta-method
             |   Contrast   Std. Err.     [95% Conf. Interval]
-------------+------------------------------------------------
      group2 |
 (A+D vs B)  |  -.2571429   .1809595      -.611817    .0975313
   (C vs B)  |   .2666667   .2470568     -.2175557     .750889
--------------------------------------------------------------

이를 통해 Fisher의 정확한 결과를 도출 할 수 있습니다 (아직 5 %는 아님).

 RECODE of |       rejected
     group |         0          1 |     Total
-----------+----------------------+----------
       A+D |        12          2 |        14 
         B |         6          4 |        10 
         C |         2          4 |         6 
-----------+----------------------+----------
     Total |        20         10 |        30 

          Pearson chi2(2) =   5.4857   Pr = 0.064
           Fisher's exact =                 0.060

고마워요! 여기서 방법 론적 문제를 이해하도록 도와 줄 수 있습니까? 특히, (1) 선험적 우려 의 특성에도 불구하고 무 방향 비교 검정 (IIUC) , (2) 단순한 조합 적 주장보다는 분포 가정을하는 검정을 사용해야하는 이유는 무엇입니까?
JD March

잘 모르겠습니다 (1). (2)의 경우, 로짓 모델을 사용하여 매우 유사한 결과를 얻습니다. 분포 모델이 다르므로 견고성이 있습니다. 매개 변수가 적은 것을 수행 할 수있는 데이터가 충분하지 않지만이 영역에서 내 자신의 무지가 될 수 있습니다.
Dimitriy V. Masterov

1
다시 (1). 내 말은-귀하의 테스트는 2- 테일 인 반면, 선험적 인 관심은 1- 테일을 허용 하는 것 같습니다 .
JD 3

1
나를 불안하게 만드는이 분석의 한 측면은 명백한 중요성 (5 % 수준에서)이 그룹 C에서 발생하는 도전뿐만 아니라 그룹 A에서 상대적으로 부족한 도전에 기인한다는 것입니다. 관련이 없습니다 : 선험적 으로 의심 되었을까요 ? 그룹 C의 선호되는 역할은 피고인의 그룹과 일치하는 것이 분명하지만 다른 그룹 또는 다른 그룹 사이 의 (가설 적으로) 명백한 불평등에 대한 선호되는 역할은 피고의 주장에 영향을 미치지 않는 것으로 보입니다. 그들의 집단에 근거한 차별 .
whuber

BTW, 당신은 그룹 C가 아닌 그룹 B의 분석을 수행 한 것으로 보입니다.
whuber

3

나는 임시 통계 방법 을 도입하는 것이 법원과 아무런 관련이 없다고 생각합니다. "표준 연습"인 방법을 사용하는 것이 좋습니다. 그렇지 않으면 새로운 방법을 개발할 수있는 자격을 증명할 수 있습니다.

더 명확하게 말하면, 귀하의 방법이 Daubert 표준을 충족시킬 것이라고 생각하지 않습니다. 또한 귀하의 방법이 자체적으로 학문적 참조를 가지고 있음을 의심합니다. 통계 전문가 증인을 고용하기 위해 경로를 찾아야 할 것입니다. 그것은 쉽게 반박 될 것이라고 생각합니다.

여기서 기본적인 질문은 "배심원이 인종 그룹과 무관하게 도전 했습니까?"

χ2

> M <- as.table(cbind(c(9, 6, 2, 3), c(1, 4, 4, 1)))
> dimnames(M) <- list(Group=c("A", "B", "C", "D"), Challenged=c("No", "Yes"))
> M
     Challenged
Group No Yes
    A  9   1
    B  6   4
    C  2   4
    D  3   1

> chisq.test(M)

        Pearson's Chi-squared test

data:  M
X-squared = 5.775, df = 3, p-value = 0.1231

Warning message:
In chisq.test(M) : Chi-squared approximation may be incorrect

Fisher 정확한 테스트를 사용하면 비슷한 결과가 나타납니다.

> fisher.test(M)

        Fisher's Exact Test for Count Data

data:  M
p-value = 0.1167
alternative hypothesis: two.sided

2×2

저의 해석은 인종적 편견을 주장 할 근거가 많지 않다는 것입니다.


1
χ2

고마워, @jvbraun, ad hoc 방법에 대한 당신의 요점은 설득력이있는 것 같습니다; 계산하고 나누는 것이 나에게 특별한 편심은 아니지만 분명히 다른 사람들은 설득력이 없다고 생각합니다!
JD 2009

이것은 실제로 한계가 고정되는 경우 중 하나이므로 Fisher의 정확한 테스트는 많은 사람들에게 더 맛 있어야합니다. Daubert에 대한 토론 에서 전문가 에게 전화 하면 Daubert 동의가 적용됩니다. (통상적으로, 일부는 통계를 제시하는 평신도들이 규칙 702에 의해 규정 된 그러한 평가를받지 않는다고 주장했다.) IMO 여기에 제시된 모든 논증은 잘 표현되어 있으며 허용되지 않을 가능성이 없다. 이러한 통계적 기술이 이러한 특정 상황에서 합법적 인 것으로 의심됩니다.
Andy W

χ2

χ22/24/6

3

나는 물었다 이전에 비슷한 질문을 (참조를 위해 여기에 내가 토론 특별한 경우입니다). 국방의 요구는 단순히 보여 일견의 가설 검정은 아마 필요한 것보다 더 큰 부담 그래서 - Batson 문제 (US 형법 가정) 차별의 경우.

그래서 :

  • n=30
  • p=6
  • k=4
  • d=10

Whuber의 이전 답변 은이 특정 결과가 초기 하 분포 에 의해 결정될 확률을 제공합니다 .

(pk)(npdk)(nd)

이 경우 Wolfram-Alpha 는 다음 같이 말합니다.

(64)(306104)(3010)=7611310.07

불행히도 나는 내가 제공 한 링크 이외의 참조가 없습니다-Wikipedia 페이지에서 초 기하 분포에 대한 적절한 참조를 파낼 수 있다고 생각합니다.

이것은 인종 그룹 A와 D가 "도전되지 않은"것인지에 대한 질문을 무시합니다. 나는 당신이 이것에 대해 합법적 인 주장을 할 수 있다는 것에 회의적입니다. 동등한 보호 조항에 이상한 왜곡이있을 것입니다. 이 특정 그룹은 너무 보호되어 있습니다! 나는 날지 않을 것이라고 생각합니다. (나는 변호사가 아니므로 소금 한 알을 섭취하십시오.)

가설 검정 을 정말로 원한다면 어떻게해야할지 모르겠습니다. 생성 할 수 있습니다(3010)χ2


블로그 게시물에서 내 생각 중 일부를 업데이트 했습니다 . 내 게시물은 Batson Challenges와 관련이 있으므로 다른 상황을 찾고 있는지 확실하지 않습니다 (1과 2에 대한 업데이트가 Batson Challenge와 관련하여 의미가 없음).

관련 기사 를 찾을 수있었습니다 (링크에서 전체 제공).

JL Gastwirth (2005). 사례 설명 : 존속 문제에 대한 데이터 분석을위한 통계 테스트 : Johnson v. California에서 차별의 주요 사건을 확립하는 데 필요한 증거의 표준을 명확히합니다. 법, 확률 및 위험 , 4 (3), 179-185.

이는 초기 하 분포를 사용하는 것과 동일한 제안을했습니다. 내 블로그 게시물에서 범주를 두 그룹으로 축소하면 Fisher의 정확한 테스트와 동등한 방법을 보여줍니다.

kk=5k=6nnd

누군가가 실제로 이것을 사용하는 (또는 분수 이외의) 판례법을 알게되면 관심이 있습니다.


1
고마워 앤디 (1) 내 변호사 친구는 C가 과도하게 도전했고 A가 저조도라고 주장하는 데 완벽하게 수용 가능하고 유용하다고 생각합니다. (2) "무엇 테스트 통계"라고 말합니다. 혼란스러운 것을 발견했습니다. 초 기하학적을 사용하여 0.07을 계산할 때 어떤 테스트 통계를 사용하고 있습니까? 그렇게하는 것은 의심 사례와 전체 사례의 비율로 확률을 계산하는 것입니다. 마찬가지로, 의심스러운 사례를 귀하보다 더 좁게 정의하는 것을 제외하고는 정확하게 내 분석이 수행합니다.
JD 3

@JonathanMarch-테스트 통계를 사용하지 않습니다. 이것은 초기 하 분포에 따라 6 개의 클래스 C 중 4 개가 다른 조건에서 임의로 선택 될 확률입니다 . 방향성 테스트의 동기를 이해하지만 일반적인 t- 테스트 사례는 아닙니다. 이 경우 연속 null 분포가 있으므로 p- 값을 제공 하려면 대안을 영역으로 정의 해야 합니다. 여기서와 같이 PMF 배포를 사용하여 암시 적으로 수행 할 필요는 없습니다.
Andy W

1
k=5k=60.07

1
86/11317.6%

1
조나단, 당신의 이익을 위해 나는 야당 전문가처럼 힘든 시간을 줄 것입니다. 이론적 근거없이 임시 통계 를 사용하기 때문에 귀하의 접근 방식이 유효하지 않다고 생각합니다 . 작은 p- 값을 생성하기 위해서만 구성된 것 같습니다. Andy의 통계량은 규정 된 귀무 가설과 대립 가설을 기반으로하며 Neyman-Pearson lemma를 사용하여 정당화 될 수 있습니다. 통계 는 결과 에 대한 사후 검사를 기반으로하는 것으로 보이며 , voir dire 이전에 (즉, 독립적으로) 주장 된 대체 가설에 해당하지 않는 것 같습니다 .
whuber

0

여러 테스트 문제를 잊지 마십시오. 항소 할 근거를 찾는 100 명의 변호인을 상상해보십시오. 모든 배심원 거부는 모든 예상 배심원에 대해 동전을 뒤집거나 주사위를 굴림으로써 수행되었습니다. 따라서 거부에 대한 인종 차별은 없었습니다.

100 명의 변호사 각각은 이제 여러분 모두가 동의 한 통계 테스트를 수행합니다. 100 개 중 대략 5 개는 "편견없는"이라는 귀무 가설을 기각하고 항소 할 근거가 있습니다.


IIUC는 판사가 각 개인의 거부 사유를 조사 할 근거를 찾고있을 것이다. 100 건 중 5 건에서 그러한 시험이 발생한 경우 실제로 문제가됩니까?
JD March
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.