Daniel Kahneman의 "Thinking, Fast and Slow"의 "평균으로의 회귀"장에서 예제를 제공하고 독자에게 전체 판매 예측과 전년도의 판매 수를 고려하여 개별 상점의 판매를 예측하도록 요청합니다 . 예를 들어 (이 책의 예에는 4 개의 상점이 있으며 여기서는 단순성을 위해 2를 사용합니다) :
Store 2011 2012
1 100 ?
2 500 ?
Total 600 660
순진한 예측은 상점 1과 2에 대해 110과 550이며 각각에 대해 10 % 증가합니다. 그러나 저자는이 순진한 접근 방식이 잘못되었다고 주장합니다. 실적이 저조한 매장은 10 % 이상 증가하고, 실적이 좋은 매장은 10 % 미만으로 증가 (또는 감소) 할 가능성이 높습니다. 따라서 115 (15 % 증가) 및 535 (7 % 증가) 예측은 순진한 예측보다 "정확한"것입니다.
내가 이해하지 못하는 것은 매장 1의 100 판매가 반드시 실적이 저조한 매장이라는 결론을 내릴 수 있다는 것입니다. 아마도 위치 차이로 인해 상점 1과 2의 실제 시계열 평균 수단은 10과 550이며, 상점 1은 2011 년에 슈퍼 년을, 상점 2는 2011 년에 비참한 해를 보냈습니다. 그러면 의미가 없습니다. 상점 1의 감소와 상점 2의 증가를 예측하기 위해?
원래 예에서는 시계열 정보가 제공되지 않았지만 "평균으로의 회귀"가 횡단면 평균을 나타내므로 시계열 정보는 중요하지 않다는 인상을 받고 있습니다. 내가 무엇을 오해하고 있습니까?