데이터를 수집하거나 해석 할 때 인간이 취하는 가장 편견은 무엇입니까?


39

나는 econ / stat 전공입니다. 나는 경제학자들이 사람들이 합리적으로 행동하지 않는 상황을 식별함으로써 인간의 행동과 합리성에 대한 그들의 가정을 수정하려고 노력했다는 것을 알고있다. 예를 들어, 내가 당신에게의 100 %의 확률로 제공한다고 가정 $ 1,000 손실 또는에서 50 %의 확률로 $ 2,500의 손실을, 사람들은 선택 $ 후자의 예상 값이보다 더 큰 손실에도 불구하고 2500 옵션을 $ 보장 1000 손실. 이것을 "손실 혐오"라고합니다. 행동 경제학자들은 이제 이러한 패턴을 연구하고 인간이 일반적으로 "합리적"행동을 구성한다고 가정 한 공리에서 벗어나는 방법을 식별하려고 노력한다. 여기서는 최소 예상 손실을 선호하는 것이 합리적이라고 가정합니다.

통계 학자들이 사람들이 데이터를 해석하는 방식에 편향된 결과를 가져 오는 데이터 수집에서 공통 패턴을 식별했는지 궁금합니다. 본질적으로 데이터를 수집하는 "합리적인"방법이 있었다면, 인간이 이것으로부터 벗어나 "바이어스"를 나타내는 예가 있다고 가정합니다. 그렇다면, 데이터를 수집하거나 해석 할 때 인간이하는 가장 편견은 무엇입니까?


5
Podsakoff 등의 훌륭한 논문이 있습니다. 일반적인 방법 편향을 검토하고 통계적 및 절차 적 치료법을 제안합니다. ln.edu.hk/mkt/staff/gcui/CommonMethodBias.pdf 표 2를 살펴보십시오.
ayhan


10
당신은 비이성에 대한 비이성적 추정을 가지고 있습니다. 유틸리티 기능을 결과에 적용하지 못했습니다. 언급 한 예에서, 그 사람이 1000 달러를 가지고 있고 지금부터 1 분 안에 갱스터에게 대출을 상환하기 위해 사용해야한다고 가정 하거나 갱스터에 의해 살해 될 것입니다. $ 1000 손실 의 100 % 확률은 100 %의 사망률을 초래하는 반면, $ 2500 손실 의 50 % 확률은 50 %의 사망률을 초래합니다. 경제학 전공으로서, 당신은 불합리성을 선언하기 전에 시작점으로 유용하게 활용해야합니다.
Mark L. Stone

3
통계 학자들은 일반적으로 그런 종류의 연구를하지 않습니다. 이 Q가 Psychology & Neuroscience SE 사이트에 더 적합한 지 궁금합니다 .
gung-복직 모니카

3
생각 가로등 효과 - 매우 일반적인 탭에 훨씬 쉽게 데이터, 특히 지금 - 빛이 밤입니다의가 있기 때문에 lightpost에서 분실 된 키 (데이터)를 찾고. // 데이터를 수집하는 연구원이 무작위 적이 지 않기 때문에 데이터를 수집하는 "합리적인 방법"이 없습니다.
AS

답변:


23

학계에서는 p- 값이 일반적으로 잘못 해석된다고 생각합니다. 사람들은 p- 값이 조건부 확률을 나타내는 것을 잊는 경향이 있습니다. 실험이 완벽하게 수행되고 선택한 통계 테스트의 모든 요구 사항이 충족 되더라도 허위 발견 속도는 일반적으로 유의 수준 알파보다 훨씬 높습니다. 오 탐지율은 통계적 힘의 감소와 진양 성의 유병률과 함께 증가합니다 (Colquhoun, 2014; Nuzzo, 2014).

또한 사람들은 자신의 추정치를 진실로 간주하고 무작위로 추정하는 매개 변수로 간주합니다 (Haller & Kraus, 2002). 예를 들어 "사례의 95 %에서이 식별 된 신뢰 구간이 매개 변수를 포함한다"고 말할 때

상관과 인과의 혼동은 아마도 데이터 해석에서 매우 일반적인 오류 일 것입니다.

데이터 수집 측면에서 일반적인 오류는 가장 대표적인 샘플보다는 가장 쉽게 액세스 할 수있는 것입니다.

Colquhoun, D. (2014). 잘못된 발견 비율 및 P 값의 잘못된 해석에 대한 조사. 왕립 학회 개방 과학, 1–15.

Nuzzo, R. (2014). 통계적 오류 : 통계 학적 유효성의 "골드 표준"인 P 값은 많은 과학자들이 생각하는 것만 큼 신뢰할 수 없습니다. 자연, 506, 150–152.

Haller, H. & Kraus, S. (2002) : 의미의 오해 : 학생들이 교사와 공유하는 문제? 온라인 심리학 연구 방법, Vol.7, No.1


19

나는 진정한 무작위성이 어떻게 보이는지를 이해할 수 없다는 것이 일반적입니다. 사람들은 무작위 이벤트 시퀀스에서 실제로 발생하는 것보다 너무 많은 가짜 패턴을 기대하는 것 같습니다. 우리가 스스로 무작위성을 시뮬레이션하려고 할 때도 나타납니다.

또 다른 매우 일반적인 것은 도박꾼의 오류와 같이 독립성을 이해하지 않는 것입니다. 우리는 때때로 이전 사건이 미래의 사건에 영향을 미치는 셔플 카드 더미의 이전 거래와 같이 불가능한 경우에도 미래 사건에 영향을 줄 수 있다고 생각합니다.


7

(행동 적) 경제학자들이 "비이성적"또는 "편향적"이라고 분류 된 많은 행동과 사고 과정은 실제로 현실에서 매우 적응력 있고 효율적이라는 것이 이미 지적되었다. 그럼에도 불구하고 OP의 질문은 흥미 롭습니다. 그러나 경제 문헌에서 논의 된 것들 (예 : 손실 혐오, 엔도 우먼트 효과, 기소 방치 등).

예를 들어, 평가 가능성 은 데이터 분석에서 분명히 문제입니다. 평가 이론 은 해석하기 쉽고 평가하기 쉬운 정보를 과체중이라고합니다. 회귀 계수의 경우를 고려하십시오. 계수의 "실제"결과를 평가하는 것은 어려운 작업 일 수 있습니다. 계수가 실제적으로 관련되어 있는지 여부를 이해하려면 독립 변수와 종속 변수의 단위뿐만 아니라 독립 변수와 종속 변수의 분포도 고려해야합니다. 반면에 계수의 중요성을 평가하는 것은 쉽습니다. 단지 p- 값을 알파 수준과 비교하기 만합니다. 계수 자체에 비해 p- 값의 평가 가능성이 더 크다는 점에서 p- 값으로 너무 많이 만들어 졌다는 것은 놀라운 일이 아닙니다.

(표준화하면 계수의 평가 가능성이 높아지지만 모호성 이 증가 할 수 있습니다. 처리중인 데이터의 "원본"형식을 사용할 수 없기 때문에 관련 정보를 사용할 수 없거나 보류되고 있다는 의미입니다.)

관련된인지 적 "바이어스"는 구체성 원칙이며, 결정 맥락에서 "바로"정보를 과체중으로 만드는 경향이 있으며, 메모리에서 검색 할 필요가 없습니다. (구체성 원칙은 또한 정보가 주어진 형식으로 정보를 사용하고 변환을 수행하지 않는 경향이 있다고 명시하고 있습니다.) p- 값 해석은 단순히 회귀 출력을보고 수행 할 수 있습니다. 모델링하는 것에 대한 실질적인 지식을 검색 할 필요가 없습니다.

통계 데이터 해석에있어 많은 편견이 문제를 해결하거나 판단을 내릴 때 쉬운 길을 택할 수 있다는 일반적인 이해에서 비롯 될 수있을 것으로 기대합니다 ( "인지 적 잘못", "경계 합리성"등 참조). . 이와 관련하여, "쉽게"무언가를하는 것은 일반적으로 우리가 결과로 믿게되는 믿음 ( 유창성 이론 )에 대한 자신감을 증가시킵니다 . (또한 더 쉽게 표현할 수있는 데이터가-우리 자신이나 다른 사람들에게-우리 분석에서 과체중입니다.) 가능한 예외를 고려할 때 이것이 특히 흥미로워 진다고 생각합니다. 예를 들어 어떤 심리학 적 연구에 따르면 문제를 해결하기 어렵다고 생각하면 덜 구체적이고 어려운 접근법과 솔루션을 선호 할 수 있습니다.


7

내가 생각할 수있는 가장 큰 단일 요인은 널리 "확인 편향"으로 알려져 있습니다. 내 연구가 보여 줄 것으로 생각되는 것을 결정한 후에, 나는 그 결론을 이끌어내는 데이터를 반박하는 것처럼 보이는 모든 데이터 포인트에 대해 변명하면서 비판적으로 받아들입니다. 내 결론에 맞지 않는 데이터 포인트를 무의식적으로 "명확한 계측기 오류"(또는 이에 상응하는 일부)로 거부 할 수 있습니다. 어떤 경우에는 그렇게 뻔뻔스럽지 않습니다. 이러한 데이터 포인트를 완전히 버리지 않고 "오류"를 제거하는 공식을 조정하여 미리 정해진 결론을 확인하는 데 편리하게 결과를 조정할 것입니다.

이것에 대해 특별히 악의적 인 것은 없습니다. 우리의 두뇌가 작동하는 방식입니다. 그러한 편견을 걸러 내려면 많은 노력이 필요하며, 과학자들이 이중 맹검 연구를 조정하여 측정을 수행하는 사람이 실험이 무엇을 증명해야하는지 알지 못하는 이유 중 하나입니다. 그런 다음 그가 충실하게 측정 한 것을 조정하지 않기 위해서는 엄청난 훈련이 필요합니다.


1
나는 이것이 데이터 수집 단계에서 이미 발생할 수 있기 때문에 이것이 실제로 가장 위험한 편견이라고 생각합니다.
stijn

1
확인 편향은 학문 분야간에 실제로 나쁠 수 있습니다. 학문의 기본 기본 주장조차도 다르기 때문에 "X는 (감지 방법을 사용하여) 당신의 학문을 (사용) 할 수는 없지만 내 것이 분명합니다 (우리는 할 수 있습니다) 감각 X) ". 예를 들어 사과는 나무에 매달 리거나 땅에 누워 있어야합니다. 그들은 그들 자신의 협정에 '떨어질'수 없습니다. 종종 물리 과학에서 혼란을 숨기는 수학적 기초의 변화가 있습니다.
Philip Oakley

6

선형성 .

데이터 해석 / 분석 중 일반적인 편견은 사람들이 일반적으로 선형 관계를 빠르게 가정한다는 것입니다. 수학적으로 회귀 모형은 결정 론적 구성 요소가 예측 변수의 선형 함수라고 가정합니다. 불행히도 항상 그런 것은 아닙니다. 나는 최근에 학부 포스터 컨퍼런스에 갔는데 선형 모델에 적합하다고 볼 수있는 무차별 2 차 또는 비선형 트렌드의 양이 가장 적 었다고 걱정했다.

(이것은 도박꾼의 오류, 값 오해 및 진정한 무작위성 에 대한 언급과 더불어 모든 관련 게시물에 +1입니다.)p


2

흥미로운 사례는 Gamblers Fallacy에 대한 토론입니다.

기존 데이터가 포함되거나 제외되어야합니까? 이미 6 개의 6 개로 앞서 있다면, 12 번의 시도에 포함되어야합니까? 이전 데이터에 대해 명확하게하십시오.

절대 숫자에서 비율로 언제 변경해야합니까? 초기 승리 행진에서 얻은 이점이 0으로 돌아 오는 시간 이 오래 걸립니다 (임의의 보행).

백만 달러의 0.1 %는 대기업에게는 크지 않지만 1000 달러를 잃는 것은 유일한 상인에게 생명과 죽음이 될 수 있습니다 (이는 투자자들이 '구동'사람들이 투자하기를 원하는 이유입니다). 백분율로 전환 할 수 있다는 것은 편견이 될 수 있습니다.

통계 학자조차도 편견이 있습니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.