"생각, 빠르고 느린"의 평균으로 회귀


14

에서 빠른 속도와 느린 생각 , 대니얼 카너먼은 다음과 같은 가상의 질문을 제기 :

(P. 186) Julie는 현재 주립 대학의 선배입니다. 그녀는 4 살 때 유창하게 읽었습니다. 그녀의 학점 평균 (GPA)은 무엇입니까?

그의 의도는 특정 통계에 대한 예측을 할 때 평균에 대한 회귀를 설명하지 못하는 방법을 설명하는 것입니다. 이후 토론에서 그는 다음과 같이 조언합니다.

(P. 190) 두 가지 측정 값 (현재의 읽기 연령과 GPA)의 상관 관계는 해당 결정 요인 간의 공유 요소 비율과 같습니다. 그 비율에 대해 가장 잘 추측하는 것은 무엇입니까? 가장 낙관적 인 추측은 약 30 %입니다. 이 추정치를 가정하면 편견없는 예측을 생성하는 데 필요한 모든 것이 있습니다. 간단한 4 단계로가는 방법은 다음과 같습니다.

  1. 평균 GPA 추정치부터 시작하십시오.
  2. 증거에 대한 인상과 일치하는 GPA를 결정하십시오.
  3. 읽기 우선 순위와 GPA 간의 상관 관계를 추정하십시오.
  4. 상관 관계가 .30이면 거리의 30 %를 평균에서 일치하는 GPA로 이동하십시오.

그의 조언에 대한 나의 해석은 다음과 같습니다.

  1. Julie의 읽기 우선 순위에 대한 표준 점수를 설정하려면 "4 살 때 유창하게 읽습니다"를 사용하십시오.
  2. 해당 표준 점수가있는 GPA를 결정하십시오. ( GPA와 읽기 우선 순위 사이의 상관 관계가 완벽 하다면 예측할 합리적인 GPA는이 표준 점수에 해당 합니다.)
  3. 읽기 우선 순위의 변동으로 GPA 변동의 비율을 설명 할 수 있습니다. (나는이 맥락에서 "상관 관계"로 결정 계수를 언급한다고 가정한다)
  4. Julie의 읽기 우선 순위 표준 점수의 30 % 만 GPA의 표준 점수를 설명 할 수있는 요소로 설명 할 수 있기 때문에 Julie GPA의 표준 점수가 원래 점수의 30 %가 될 것으로 예상 할 때만 정당화됩니다 완벽한 상관의 경우.

Kahneman의 절차에 대한 나의 해석은 정확합니까? 그렇다면 그의 절차, 특히 4 단계에 대한 공식적인 수학적 정당성이 있습니까? 일반적으로 두 변수 간의 상관 관계와 표준 점수의 변경 / 차이는 어떤 관계입니까?

답변:


2

Kahneman의 절차에 대한 나의 해석은 정확합니까?

Kahneman의 2 단계는 다음과 같이 매우 정확하게 공식화되어 있지 않기 때문에 말하기 어렵습니다. "증거에 대한 인상과 일치하는 GPA를 결정하십시오"-정확히 무슨 의미입니까? 누군가의 인상이 잘 교정 되었다면, 평균을 교정 할 필요가 없습니다. 누군가의 인상이 심하게 어긋나면 오히려 더 강하게 교정해야합니다.

그래서 나는 Kahneman의 조언이 단지 규칙이라는 @AndyW에 동의합니다.

[...] 그의 절차, 특히 4 단계에 대한 공식적인 수학적 근거가 있습니까? 일반적으로 두 변수 간의 상관 관계와 표준 점수의 변경 / 차이는 어떤 관계입니까?

와이엑스ρ

와이=ρ엑스,

엑스와이ρ

이것이 바로 "평균에 대한 회귀"입니다. Wikipedia 에 대한 토론에서 일부 수식과 파생을 볼 수 있습니다 .


8

숫자 순서가 Kahneman 인용 부호와 일치하지 않습니다. 이 때문에 전반적인 요점이 누락 된 것 같습니다.

Kahneman의 요점은 가장 중요합니다. 말 그대로 모든 사람의 평균 GPA를 추정한다는 의미입니다. 이 조언의 핵심은 그것이 당신의 닻이라는 것입니다. 당신이 제공하는 예측은이 기준점 주위의 변화를 참조해야합니다. 나는 당신의 요점 에서이 단계를 볼 수 있는지 확실하지 않습니다!

Kahneman은 WYSIATI라는 약어를 사용합니다. 이것은 현재 이용 가능한 정보의 중요성을 과대 평가하려는 인간의 경향입니다. 많은 사람들에게 읽기 능력에 관한 정보는 줄리가 똑똑하다고 생각하게하므로 사람들은 똑똑한 사람의 GPA를 추측 할 것입니다.

그러나 4 세 아동의 행동에는 성인 행동과 관련된 정보가 거의 없습니다. 예측을 할 때 무시하는 것이 좋습니다. 그것은 단지 당신의 앵커에서 소량 만 흔들어야합니다. 또한 사람들은 똑똑한 사람 GPA를 처음 추측하면 매우 정확하지 않을 수 있습니다. 선발로 인해, 대학에서 노인의 대다수는 평균 지능 이상입니다.

4 살 때 줄리의 독해 능력 외에 실제로 다른 숨겨진 정보가 질문에 있습니다.

  • 줄리는 여자 이름 일 가능성이 높다
  • 그녀는 주립 대학교에 다니고 있습니다
  • 그녀는 선배

이러한 세 가지 특성이 전체 학생 인구에 비해 평균 GPA를 약간 올릴 것으로 생각합니다. 예를 들어, 나는 GPA가 매우 나쁜 학생들이 중퇴하기 때문에 Senior 's는 Sophmores보다 GPA가 높을 가능성이 높습니다.

따라서 Kahneman의 절차 (가설)는 다음과 같이 진행됩니다.

  1. 주립 대학교에서 여자 노인의 평균 GPA는 3.1입니다.
  2. 줄리의 고급 읽기 능력을 4로했을 때 GPA가 3.8이라고 생각합니다.
  3. 4 살 때의 읽기 능력은 GPA와 0.3의 상관 관계가 있다고 생각합니다.
  4. 그런 다음 3.1과 3.8 사이의 30 %는 3.3입니다 (즉 3.1 + (3.8-3.1)*0.3)

따라서이 가설에서 Julie의 GPA에 대한 최종 추측은 3.3입니다.

Kahneman의 접근 방식의 평균에 대한 회귀는 2 단계가 사용 가능한 정보의 중요성을 크게 과대 평가할 가능성이 있다는 것입니다. 따라서 더 나은 전략은 예측을 전체 평균으로 되 돌리는 것입니다. 3 단계와 4 단계는 회귀 량을 추정하는 (임시) 방법입니다.


나는 절차의 직관을 이해하지만 수학적 정당화는 이해하지 못한다. 저의 해석은 평균 GPA를 평가하는 요점은 표준 점수로 특정 GPA를 추정 할 수있게하는 것입니다. 그렇지 않으면 읽기 사전 읽기와 비교할 수 없었습니다. (계속.)
식량

1
Kahneman은 대부분의 사람들이 GPA = 3.7 또는 3.8이라고 생각하는데, 이는 아마도 Julie의 읽기 우선 순위와 관련된 표준 점수와 일치하지만 두 변수 사이의 상관 관계가 완벽하다고 암시 적으로 가정합니다. 나는 4 단계가 직관에 근거한 경험 법칙인지 통계적으로 유효한 실제 절차인지에 대해 혼란스러워한다 (즉, 표준 점수를 부가 적으로 처리하고 상관 관계에 따라 그 비율을 취할 수 있는가?). 그것이 평신도의 경험 법칙이라면 통계적으로 더 엄격한 근사법이 있습니까?
식량

"가산 적으로", 나는 (1) 줄리의 표준 점수 GPA의 일부 비율이 그녀의 독해 전 조성을 설명 할 수있는 요소들에 의해 설명된다고, (2) 그녀의 표준 점수 GPA의 나머지 비율이 요인들에 의해 설명된다는 가정을 언급하고있다 GPA를 설명하는 데있어 고유 한 점은 (3) 합산 된 기여가 줄리에 대해 예측 한 최종 표준 점수 GPA와 동일하며 (4) 편향된 예측의 비율을 취함으로써 예측을 수정할 수 있다는 것입니다. 예를 들어, 제곱근으로 작업하는 것과는 대조적으로 이와 같은 표준 편차 비율로 작업하는 것이 유효합니까?
식량

임시 규칙입니다. 2 단계와 3 단계는 반드시 논리적으로 서로 일치 할 필요는 없습니다. (동일한 정보를 말하는 두 가지 방법이 있습니다. 하나는 효과 크기이고 다른 하나는 표준화 된 효과 크기입니다.)
Andy W
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.