다른 답변은 여기에서 무시하십시오. 이것은 실제로 역설 이 아닙니다 . 여기서 모든 사람들이 무시하고있는 실제 문제는 당신이 실제로보고 있는 확률을 착각하고 있다는 것 입니다. 실제로 제안 된 예제 (마케팅)에서 자체적으로 사용하고 해석하는 두 가지 완전히 다른 평균과 통계가 있습니다.
우선 고객 당 구매 한 평균 제품 수가 있습니다. 평균적으로 한 고객이 1.6 개 품목을 구매합니다. 물론 고객은 제품의 0.6을 초과 할 수 없습니다 (연속 측정 값이있는 쌀이나 곡물이 아니라고 가정).
둘째, 특정 제품을 구매하는 평균 고객 수가 있습니다. 이상하게 들리나요? 평균적으로 제품은 5.33333333 ... 고객이 구매합니다. 그러나 이것은 다릅니다. 여기서 설명하는 것은 구매 한 제품 수 (3 개뿐)가 아니라 실제로 해당 제품을 구매 한 사람들의 수입니다.
이 두 가지 값을 다음과 같이 생각하십시오.이 두 값은 고객이 하나만 있거나 제품이 하나 뿐인 경우 무엇을 나타 냅니까? 결국, 단일 데이터 포인트의 평균은 주어진 데이터 포인트에 불과합니다.
또는 더 나은 방법은 차트를 사용하여 제품을 구매하는 데 지출 한 금액을 달러로 계산하는 것입니다. 분명히 개별 고객이 소비 한 평균 금액은 대기업 (또는 소규모 사업자)이 공급하는 제품이 평균적으로 산출 한 금액보다 훨씬 적습니다. 회사의 안녕을 논의 할 때 두 가지 가치를 모두 사용하는 좋은 방법을 생각할 수 있습니다.
이것을 마케팅 담당자에게 설명 할 때 내가 말한 것처럼 설명하십시오. 역설이 아닙니다. 완전히 다른 통계 일뿐입니다. 여기서 유일한 문제는 실제로 차트를 읽는 두 가지 방법 (즉, 제품 당 구매하는 사람 수와 사람당 구매 한 제품 수)을 읽는 두 가지 방법이 있다는 사실을 알았습니다.
tl; dr 가장 먼저 설명한 것은 개별 고객이 제품 구매에 기꺼이 쓰는 평균 금액입니다. 두 번째는 일반인의 특정 제품에 대한 평균 수요입니다. 두 가지가 모두 같은 것이 아닌 이유를 지금 알 수 있습니다. 그것들을 그렇게 비교하면 쓰레기 정보를 얻을 수 있습니다.
편집하다
실제로 일부 제품 a, b 또는 c를 구매하는 고객이 소비 한 평균 돈에 대한 질문이있는 것 같습니다. 좋구나. 이것은 실제로 계산 오류입니다. 나는 이것을 역설이라고 부르지 않을 것이다. 정말 미묘한 보풀입니다.
열을보십시오. 열간에 공유되는 사람들이 있습니다. 적절한 가중 평균을 했다고 가정 해 봅시다 . 여전히 사람들을 두 번 추가하고 있습니다. 즉, 평균에는 2 이상의 값을 가진 추가 인원이 포함됩니다. 이제 평균은 얼마입니까? 1.6이었다! 본질적으로 평균은 다음과 같습니다.
∑엔나는 = 0v a l u e O f피e r s o n나는※ v a l u e O f피e r s o n나는엔
그것은 확실히 올바른 공식이 아닙니다. 상호 배타성을 가정하지만 상황에서 실제 평균을 얻도록 조정하는 방법은 가중 평균입니다.
∑엔나는 = 0n u m b e r O f피e o p l e B u yI N g나는* V의 예는 r에 g을전자 Sp e n t B y피e r s o n B u yI N g나는엔
어느 쪽이든 엉망 평균을 얻을 수 있습니다. 한 범주가 평균적으로 "무게"가 높기 때문에 한 가지 실수는 가중 평균의 필요성을 무시하는 것이 었습니다. 밀도와 같습니다. 하나의 가치는 사람들이 더 밀집되어 있음을 나타냅니다. 다른 문제는 중복 추가로 평균이 왜곡됩니다. 그래도이 "역설"중 하나를 부르지는 않습니다. 일단 당신이하고있는 것을 보았을 때 그것이 왜 효과가 없는지 나에게 분명해 보였습니다. 가중 평균은 필요에 따라 다소 설명이 필요합니다. 이제 값을 여러 번 추가 한 것 같습니다 ... 작동하지 않습니다. 기본적으로 값의 제곱 평균을 취했습니다.