HoraceT와 CliffAB (댓글이 너무 길어서 죄송합니다) 나는 평생의 모범을 보았으며, 사람들을 화나게하지 않으려면 그들의 설명에 매우주의해야한다고 가르쳤다. 그래서 나는 당신의 방종을 원하지 않지만, 당신의 인내심을 요구합니다. 간다 :
극단적 인 예를 시작하기 위해 문맹 인 마을 농부들 (동남아시아)에게 '경제적 수익률'을 추정하도록 요청한 설문 조사 질문을 보았습니다. 응답 옵션을 제외하고 우리는 이것이 어리석은 일임을 알 수 있지만 어리석은 이유를 일관되게 설명하는 것은 쉽지 않습니다. 예, 우리는 응답자가 질문을 이해하지 못하고 의미 론적 문제로 기각하기 때문에 바보라고 말할 수 있습니다. 그러나 이것은 연구 맥락에서 실제로 충분하지 않습니다. 이 질문이 제안되었다는 사실은 연구원들이 '멍청한'것으로 간주하는 것에 내재 된 가변성이 있음을 의미합니다. 이를보다 객관적으로 다루기 위해, 우리는 그러한 것들에 대한 의사 결정을위한 관련 프레임 워크를 물러나서 투명하게 선언해야합니다. 많은 옵션이 있습니다.
따라서 분석에 사용할 수있는 두 가지 기본 정보 유형 (정 성적 및 정량적)이 있다고 가정합니다. 그리고이 둘은 모든 양적 정보가 정성적인 정보로 시작되었지만 다음과 같은 (과 단순화 된) 단계를 거치도록 변형 과정과 관련이 있습니다.
- 컨벤션 설정 (예 : 우리는 [개별적으로 인식하는 방법에 관계없이] 낮의 열린 하늘의 색을 "파란색"이라고 부르기로 결정했습니다.)
- 분류 (예 : 우리는이 규칙에 따라 방의 모든 것을 평가하고 모든 항목을 '파란색'또는 '파란색이 아닌'범주로 분리)
- 계산 (우리는 방에있는 파란색 물건의 '수량'을 계산 / 감지합니다)
1 단계가없는 (이 모델에서는) 품질과 같은 것은 없으며 1 단계로 시작하지 않으면 의미있는 수량을 생성 할 수 없습니다.
일단 언급하면,이 모든 것이 매우 명백해 보이지만, 가장 일반적으로 간과되어 '쓰레기 유입 (Garbage-In)'을 초래하는 것은 첫 번째 원칙들입니다.
따라서 위의 예에서 '어리 석음'은 연구원과 응답자 사이에 공통된 규칙을 설정하지 못하는 것으로 매우 명확하게 정의 할 수 있습니다. 물론 이것은 극단적 인 예이지만 훨씬 더 미묘한 실수는 가비지 생성과 동일 할 수 있습니다. 제가 본 또 다른 사례는 소말리아 농촌 지역의 농민들을 대상으로 한 설문 조사인데,“기후 변화가 당신의 생계에 어떤 영향을 미쳤습니까?”라고 물었습니다. 미국은 연구자와 응답자 사이의 공통된 협약 (즉, '기후 변화'로 측정되는 것에 관한)을 사용하지 않는 것이 심각하다.
이제 응답 옵션으로 넘어 갑시다. 응답자가 여러 선택 옵션 또는 유사한 구성으로 응답을 자체 코드화 할 수있게함으로써이 '협약'문제를 이러한 질문의 측면으로 추진하고 있습니다. 우리가 모두 반응 범주에서 '보편적 인'협약을 효과적으로 고수한다면 문제가되지 않을 수 있습니다 (예 : 질문 : 당신은 어느 도시에 살고 있습니까? 반응 범주 : 연구 지역에있는 모든 도시 목록 [그리고 '이 지역에 있지 않음']). 그러나 많은 연구자들은 실제로 자신의 요구를 충족시키기 위해 질문과 응답 범주의 미묘한 뉘앙스에 자부심을 갖고있는 것 같습니다. '경제 수익률'질문이 나타난 동일한 조사에서, 연구원은 응답자 (가난한 마을 사람들)에게 그들이 어떤 경제 부문에 기여했는지를 물었다 : '생산', '서비스', '제조'및 '마케팅'. 여기서도 질적 협약 문제가 분명히 발생합니다. 그러나 그는 응답을 상호 배타적으로 만들었 기 때문에 응답자는 한 가지 옵션 만 선택할 수 있었기 때문에 (“그러한 방식으로 SPSS에 공급하는 것이 더 쉽기 때문에”), 농부는 일상적으로 작물을 생산하고 노동을 판매하며 수공예품을 제조하고 모든 것을 가져갑니다. 현지 시장 자체에서이 특정 연구원은 응답자와 컨벤션 문제가있을뿐 아니라 현실 자체와도 관련이있었습니다.
그렇기 때문에 저와 같은 오래된 보어는 항상 데이터 수집 후 데이터에 코딩을 적용하는보다 작업 집약적 인 접근 방식을 권장합니다. 적어도 연구원이 개최하는 컨벤션에서 코더를 적절하게 훈련시킬 수 있습니다 (그리고 이러한 컨벤션을 ' 설문 조사 지침은 머그잔 게임입니다. 지금 당장 나를 믿으십시오). 또한 위의 '정보 모델'(다시 말해서 주장하지 않아도 됨)을 수락하면 준-구형 응답 스케일의 평판이 나쁜 이유도 나타냅니다. 그것은 스티븐의 협약에 따른 기본적인 수학 문제가 아닙니다 (즉, 서수에 대해서도 의미있는 원점을 정의해야하며 추가하거나 평균을 지정할 수없는 등). 또한 '정량화'에 해당하는 투명하게 선언되고 논리적으로 일관된 변환 프로세스를 거치지 않은 경우가 많습니다 (즉, '기본 수량'생성을 포함하는 위에서 사용 된 모델의 확장 된 버전입니다. [-어렵지는 않습니다. 할 것]). 어쨌든, 그것이 질적 또는 양적 정보가되기위한 요구 사항을 충족시키지 못하면, 연구원은 실제로 틀 밖에서 새로운 유형의 정보를 발견했다고 주장하고 있으며, 따라서 기본 개념을 완전히 설명 할 책임이있다. 즉, 새 프레임 워크를 투명하게 정의).
마지막으로 샘플링 문제를 살펴 보겠습니다 (이것은 이미 여기에있는 다른 답변과 일치한다고 생각합니다). 예를 들어, 연구원이 '자유'유권자를 구성하는 것에 대한 협약을 적용하려면 표본 추출 체제를 선택하는 데 사용하는 인구 통계 정보가이 협약과 일치하는지 확인해야합니다. 이 수준은 일반적으로 연구자 통제 범위에 속하기 때문에 가장 쉽게 식별하고 처리 할 수 있으며 대부분 연구에서 투명하게 선언 된 가정 된 정 성적 규칙의 유형입니다. 이것이 또한 일반적으로 논의되거나 비판되는 수준 인 반면, 더 근본적인 문제는 해결되지 않습니다.
설문 조사자들은 '이 시점에서 누가 투표 할 계획입니까?'와 같은 질문을 고수하지만, 우리는 여전히 괜찮을 것입니다.