“모든 파란 티셔츠를 입은 사람”은 체계적인 표본입니까?


17

나는 인트로 통계 수업을 가르치고 있으며 모든 kth 개인 또는 객체를 샘플링하는 체계적 샘플링을 포함하여 샘플링 유형을 검토하고있었습니다.

한 학생이 특정 특성을 가진 모든 사람을 채취하여 동일한 결과를 얻을 수 있는지 물었습니다.

예를 들어, 파란색 티셔츠로 모든 사람을 샘플링하면 무작위로 충분하고 전체 인구를 충분히 표현할 수 있습니까? 적어도 "무엇을 입고 티셔츠를 선호합니까?"이외의 질문을하는 경우 내 감각은 아니요, 그러나 여기에 누군가가 이것에 대해 어떤 생각이 있는지 궁금합니다.


12
스코틀랜드 글래스고에 살았다면 "파란색 티셔츠"를 입는 대부분의 사람들은 아마도 레인저스 지지자가 될 것입니다 . 셀틱 서포터를 놓치게 될 것 입니다. 글래스고에서 축구 팀은 종교의 대리자가 될 것입니다.
csgillespie 2013

1
@csgillespie 멋진 예!
whuber

서양 문화의 파란색 남성과 연관되어 있기 때문에, 당신은 여자보다 남자를 얻을 수 있습니다
롤랜드 Kofler가

컬러 티셔츠는 흰색 티셔츠보다 비싸며 모든 디자인이 모든 색상에 적용되는 것은 아닙니다. 따라서 무해한 것처럼 보일 수도 있지만 티셔츠를 입은 사람들조차도 부유 한 사람들, 더 충동적인 소비자 또는 특정 정당을 선호하는 사람들을 선택할 수 있습니다.
Douglas Zare 2013

나이와 티셔츠 착용, 문화적 배경과 티셔츠 착용 사이에 연관성이 있습니다.
Glen_b-복지 주 모니카

답변:


22

일반적으로 귀하의 질문에 대한 대답은 "아니오"입니다. 집단 (특히 인간)으로부터 무작위 표본을 얻는 것은 매우 어렵다. 특정 특성을 조절함으로써 , 임의의 샘플을 얻지 못하는 정의에 의한 것입니다. 이것이 얼마나 많은 편견인지는 또 다른 문제입니다.

약간 터무니없는 예로서, 당신은 인구가 "축구 팬"이더라도 곰과 패커 사이의 축구 경기에서 이런 식으로 샘플링하고 싶지 않을 것입니다. 관심있는 수량이 축구와 직접적으로 관련이없는 것처럼 보이지만 곰 팬은 다른 축구 팬과 다른 특성을 가질 수 있습니다.

이러한 방식으로 샘플을 얻는 결과 숨겨진 바이어스의 많은 유명한 예가 있습니다. 예를 들어, 전화 조사가 실시 된 최근 미국 선거에서, 휴대 전화 만 가지고 있고 유선 전화가없는 사람들은 표본에서 (아마도 극적으로) 대표되지 않는 것으로 여겨집니다. 이 사람들은 유선을 사용하는 사람들보다 크고 젊기 때문에 편향된 표본을 얻습니다. 더욱이, 젊은 사람들은 노인 들과는 매우 다른 정치적 신념을 가지고 있습니다. 따라서 이것은 샘플이 특정 특성에 의도적으로 컨디셔닝 되지 않은 경우에도 여전히 그런 방식으로 발생한 경우의 간단한 예입니다 . 그리고, 여론 조사는 아무 상관없었지만 컨디셔닝 특성을 사용하여 (즉, 유선 사용 여부), 폴링의 결론에 대한 컨디셔닝 특성의 효과는 통계적으로나 실제적으로 중요했습니다.


6

단위를 표본으로 선택하기 위해 사용하는 특성의 분포가 추정하고자하는 모집단의 특성 분포와 직교하는 한, 그에 대한 선택을 조정하여 모집단 수량의 편향 추정치를 얻을 수 있습니다. 샘플은 엄격하게 무작위 샘플이 아닙니다 . 그러나 사람들은 표본으로 단위를 선택하는 데 사용되는 임의의 변수가 임의적이지 않기 때문에 모집단 특성 분포와 직교하기 때문에 임의 표본이 양호하다는 것을 간과하는 경향이 있습니다.

Bernoulli에서 P (invlogit (x_i))로 무작위로 그리는 것을 생각해보십시오. 여기서 [-inf, inf]의 x_i는 Cov (x, y)! = 0이고 y는 모집단 특성입니다. 당신이 추정하고 싶다는 것을 의미합니다. 샘플은 샘플을 선택하기 전에 무작위 화한다는 의미에서 "임의"입니다. 그러나 표본은 y의 모집단 평균에 대해 공정하지 않은 추정치를 산출하지 않습니다.

당신이 필요로하는 것은 무작위로 할당 된만큼 좋은 변수의 샘플로 선택을 조절하는 것입니다 . 즉, 그것은 관심의 양이 의존하는 변수와 직교합니다. 무작위 화는 무작위 화 자체가 아니라 직교성을 보장하기 때문에 좋습니다.


4
이것은 정확하지만 실제로 임의의 표본이 없다면 직교인지 어떻게 알 수 있습니까?
Peter Flom-Monica Monica 복원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.