1000 명 중 900 명이 자동차가 파란색이라고 말하면 파란색 일 확률은 얼마입니까?


114

처음에는 자연 텍스트를 분류하기 위해 모델에서 수행하는 일부 작업과 관련하여 발생했지만 단순화했습니다. 아마도 너무 많습니다.

당신은 파란 차를 가지고 있습니다 (일부 객관적인 과학적 척도-파란색입니다).

1000 명에게 보여줍니다.

900은 파란색이라고 말합니다. 하지 마십시오.

차를 볼 수없는 사람에게이 정보를 제공합니다. 그들이 아는 것은 900 명이 파란색이라고 말하고 100 명은 그렇지 않다는 것입니다. 이 사람들에 대해 더 이상 아무것도 모른다 (1000).

이를 바탕으로 "차가 파란색 일 확률은 얼마입니까?"

이것은 내가 요구 한 사람들 사이에 엄청난 의견 차이를 일으켰습니다! 정답이 있다면 무엇입니까?


162
차려 입었다 면 답이 어떻게 될지 궁금합니다 .
user1717828

13
사람들에게 질문은 무엇입니까? "차가 파란가요?" 또는 "자동차는 어떤 색입니까?"
kon psych

13
차가 파란색이라는 것은 무엇을 의미합니까? 어떤 사람들은 차가 파란색이 아니라고하면 어떤 사람들은 파란색이라고 부르고 다른 사람들은 다른 이름으로 부르는 색일 것입니다. 그렇다고 색상에 동의하지 않는다는 의미는 아니며 색상 이름에 동의하지 않는 것입니다.
Ben

7
나는 당신이 직면 한 다른 의견을 주면 질문이 많이 개선 될 것이라고 생각합니다. 현재 상황에서 답은 확률 이론에서 색 이론 또는 심지어 생물학 (색맹)에 이르기까지 전체 분야를 열렬히 탐구 할 수 있으며, 이것이 실제로 어떻게 도움이 될지는 모르겠습니다.
AnoE

32
문제 설명에 빠진 것이 있습니다. 100 명은 파란색 일 때 차가 파란색이라고 부인합니다. 많은 사람이 있습니다. 단순히 임의의 실수로 버릴 수는 없습니다.
Aksakal

답변:


117

TL; DR : 사람들이 자동차 색상을 판단하는 데 무리가 있다고 생각하지 않거나 파란 차가 부당하게 드문 경우를 제외하고, 귀하의 예에서 많은 사람들이 자동차가 파란색 일 확률은 기본적으로 100 %라는 것을 의미합니다.

Matthew Drury는 이미 정답을 제시했지만 숫자 예제를 사용하여 여기에 추가하고 싶습니다. 실제로 다양한 매개 변수 설정에 대해 비슷한 대답을 얻을 수 있도록 숫자를 선택했기 때문입니다. 예를 들어, 당신의 의견 중 하나에서 말했듯이 사람들이 자동차의 색상을 올바르게 판단 할 확률은 0.9라고 가정 해 봅시다. 즉 : 도 및 P ( 가 파란색 아니라고 | 차가 아니다 파란색 ) = 0.9

(파란색이라고 말해|차는 파란색이다)=0.9=1(파란색이 아니라고 말해|차는 파란색이다)
(파란색이 아니라고 말해|차가 파란색이 아닙니다)=0.9=1(파란색이라고 말해|차가 파란색이 아닙니다)

그것을 정의한 후에, 우리가 결정해야 할 나머지 것은 : 차가 파란색 일 확률은 얼마입니까? 무슨 일이 일어나는지 알기 위해 매우 낮은 확률을 고르고 이라고 말하십시오 . 즉, 모든 자동차의 0.1 %만이 파란색입니다. 그런 다음 자동차가 파란색 인 사후 확률은 다음과 같이 계산할 수 있습니다.(차는 파란색이다)=0.001

(차는 파란색이다|답변)=(답변|차는 파란색이다)(차는 파란색이다)(답변|차는 파란색이다)(차는 파란색이다)+(답변|차가 파란색이 아닙니다)(차가 파란색이 아닙니다)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0.999

당신이 분모를 보면, 그것은 합의 조건의 상대적인 크기의 비율에 의해 지배되기 때문에 그 금액의 두 번째 항은 무시할 수있을 것입니다 꽤 분명 0.1 (900) 의 순서 인 (10) 58 . 실제로 컴퓨터 에서이 계산을 수행하면 (숫자 언더 플로 문제를 피하기 위해주의를 기울임) 1 (기계 정밀도 내)과 동일한 답변을 얻습니다.0.99000.19001058

이전 확률이 실제로 중요하지 않은 이유는 하나의 가능성 (자동차는 파란색)과 다른 가능성에 대한 많은 증거가 있기 때문입니다. 이것은 우리가 다음과 같이 계산할 수 있는 우도 비율에 의해 정량화 될 수 있습니다 :

(답변|차는 파란색이다)(답변|차가 파란색이 아닙니다)=0.9900×0.11000.1900×0.910010763

따라서 사전 확률을 고려하기 전에 한 가지 옵션이 다른 옵션보다 천문학적으로 더 가능성이 높다는 것을 암시하며, 차이를 만들기 전에 파란 차는 불합리하고 어리석게 드 물어야합니다. 지구상에서 0 대의 파란 차를 찾으십시오).

그렇다면 사람들이 자동차 색상에 대한 설명에서 얼마나 정확한지를 바꾸면 어떻게 될까요? 물론, 우리는 이것을 극단적으로 밀어 붙일 수 있으며 그들이 단지 50 %의 시간을 정확히 얻을 수 있다고 말할 수 있습니다. 이 경우 사람들의 대답이 우리에게 아무 것도 말하지 않았기 때문에 자동차가 파란색이라는 사후 확률은 단순히 이전 확률과 동일합니다. 그러나 사람들은 적어도 그것보다 조금 더 잘하고, 심지어 사람들이 시간의 51 % 만 정확하다고 말하더라도 가능성 비율은 여전히 차가 파란색 일 가능성 이 대략 배 더 높습니다. .1013

이것은 모두 귀하의 예에서 선택한 다소 큰 숫자의 결과입니다. 차가 파란색이라고 말한 사람이 9/10 명이라면, 같은 비율의 사람들이 한 캠프와 다른 캠프에 있었음에도 불구하고 매우 다른 이야기 였을 것입니다. 통계적 증거는이 비율에 의존하지 않고 반대 세력 간의 수치 적 차이에 의존하기 때문입니다. 실제로, 증거를 정량화하는 우도 비율에서, 자동차가 파란색이 아니라고 말하는 100 명의 사람들은 파란색이라고 말하는 900 명의 사람들 중 100 명을 완전히 취소하므로 800 명의 사람들이 모두 동의하는 것과 같습니다 파란색이었습니다. 그리고 그것은 분명히 명백한 증거입니다.

(편집 : Silverfish가 지적했듯이 여기서 내가 만든 가정은 실제로 사람이 파란색이 아닌 차를 잘못 묘사 할 때마다 파란색이라고 말하는 것을 기본으로 함을 암시합니다. 물론 실제로 어떤 색이라도 말할 수 있기 때문에 현실적이지는 않습니다. 사람들이 파란 자동차가 아닌 파란 자동차를 파란 자동차로 착각 할 가능성이 적기 때문에 파란 ​​자동차에 대한 증거가 더 강력하다는 결론에는 아무런 차이가 없습니다. 따라서 위의 숫자는 실제로 청색 증거의 하한값 일뿐입니다.)


11
+1. 실제로 OP의 데이터를 고려할 때 사람들이 얼마나 자주 정확한지에 대한 MLE 추정치는 900 / 1000 = 90 %입니다.
amoeba

5
시간의 50 %에 맞는 자동차 색상을 얻는 것은 동전을 뒤집는 것과 다릅니다. 결국, 두 가지 이상의 사용 가능한 색상이 있습니다. 또한 "파란색"대신 "네이비"또는 "아즈 레"라고 말하는 사람이 있습니까? 사실, 정답은 "거의 파란색처럼 보이는 일부 공상적이고 세련된 특허받은 색"일 때 "청색"이라고 잘못 말할 것입니다.
Hagen von Eitzen

10
나는 이것이 단지 예시적인 수치라는 것을 알고 있지만, "사람들이 자동차의 색상을 올바르게 판단 할 확률이 0.9"라면, 파란색에 특별한 것이 없다면 p를 주장하는 것이 합리적이라고 생각하지 않습니다. 파란색입니다. 차는 파란색이 아닙니다) = 0.1. 시간의 90 %가 사람들이 올바른 색상을 식별하면 p (빨간색 | 자동차가 빨간색이라고 함) = p (백색 | 자동차가 흰색이라고 함) = p (녹색 | 자동차가 초록색이라고 함) = 0.9 가능한 모든 자동차 색상에 적용됩니다. 그러나 왜 p (청색 | 자동차는 빨간색) = p (청색 | 자동차는 흰색) = p (청색 | 자동차는 녹색) = 0.1이어야합니까? 이것은 예를 들어 p (백색은 적색) = 0을 의미한다.
Silverfish

2
@PatMolloy : 반드시 그런 것은 아닙니다. 확률이 대칭인지 여부에 달려 있습니다. 누군가가 파란 차가 아닌 파란색으로 실수하는 것처럼 누군가가 파란 차가 아닌 파란색으로 실수를 저지를 가능성이 있습니까? 그렇다면 500/500 평결은 동전 던지기만큼 정확한 정보를 제공합니다. 그러나 사람들이 파란색이 아닌 자동차가 파란색이라고 말할 가능성이 적다면, 파란색 자동차가 파란색이 아니라고 말하는 것보다 500 명의 블루 사이어가 500이 아닌 블루 사이어보다 설명하기가 더 어렵습니다. 파란색이 아닌 가설. 이 경우 증거의 균형이 파란색으로 기울어집니다.
루벤 반 베르겐 (Bergen)

3
색 인식은 까다로운 일입니다. 10 명 중 9 명이 드레스 가 흰색과 금색 이라고 말하면 파란색과 검은 색의 확률은 무엇입니까?
Glen_b

73

정답은 문제에 명시되지 않은 정보에 따라 달라지며, 하나의 결정적인 답을 도출하기 위해 더 많은 가정을해야합니다.

  • 차가 파란색 인 사전의 확률, 즉 아직 아무에게도 물어 보지 않았다면 차가 파란색이라는 믿음.
  • 확률 누군가가 실제로 때 차량이 파란색을 알려줍니다 이다 , 파랑, 실제로 때 당신을 말할 확률이 차량은 파란색입니다 하지 않습니다 파란색.
  • 누군가 말했을 때 차가 실제로 파란색 일 확률, 누군가 말했을 때 차가 파란색이 아닐 확률.

이러한 정보를 사용하여 Bayes의 공식으로 모든 것을 분해하여 자동차가 파란색 일 가능성이 높은 사후 확률을 도출 할 수 있습니다. 한 사람 만 요청하는 경우에 중점을 두지 만 명 에게 요청하는 경우에도 동일한 추론을 적용 할 수 있습니다 .1000

Ppost(car is blue)=P(car is bluesay is blue)P(say is blue)    +P(car is bluesay is not blue)P(say is not blue)

우리는 계속해서 를 세분화해야합니다 ( 예 : 파란색 ) . 이것은 이전이 오는 곳입니다.P(say is blue)

P(say is blue)= P(say is bluecar is blue)Pprior(car is blue)+P(say is bluecar is not blue)Pprior(car is not blue)

따라서 베이 즈 규칙의 두 가지 응용 프로그램이 있습니다. 특정 상황에 대한 정보 또는 합리적인 가정을 기반으로 지정되지 않은 매개 변수를 결정해야합니다.

다음을 기반으로 가정 할 수있는 다른 조합이 있습니다.

P(say is bluecar is blue)P(car is blue)=P(car is bluesay is blue)P(say is blue)

처음에는 이러한 것들을 전혀 모른다. 따라서 당신은 그들 중 세 가지에 대해 합리적인 가정을해야하며, 네 번째는 거기에서 결정됩니다.


5
종종 그렇습니다. 그런 다음 두 가지 옵션이 있습니다. 파란색이 아니라고 가정하면 총 지식 부족을 표현할 수 있습니다. 이 같은 뭔가 도움이 분야의 빠른 설문 조사를 수행 en.wikipedia.org/wiki/Car_colour_popularity
마태 복음 드 루리

18
@Matthew "파란색과 파랑 색이 같지 않다"는 문제는 일관성이 없다는 것입니다. 가능한 모든 자동차 색상에 동일한 추론을 적용하면 모두 동시에 50 % 확률 (확률 법칙에 따라 두 가지 색상 이상 불가능) 및 50 % 미만 확률 ( "흰색이 아님"과 "빨강이 아님"에서 파란색을 보시면 색상이 여러 값을 가질 수 없기 때문에 모순이 생길 수 있습니다)
Glen_b

2
사람들의 답변이 독립적 일 필요는 없기 때문에 이것보다 더 구체적으로 지정되지 않은 정보가 있습니다 (사실, 우리 그들이 독립적 인 것과는 거리가 먼 객관적인 색과 강한 상관 관계 가 있기바랍니다 ). 답변이 "과도하게"의존적이라면 어떻게해야합니까? 예를 들어, 우리는 단순히 10 명의 무작위 보행자에게 물어 보지만, 각각 100 번씩 답장을 했습니까?
Hagen von Eitzen

2
@HagenvonEitzen과 MatthewDrury. 실제로, 또한 당신이 가정해야 할 것은 독립성이 아니라 조건부 독립 입니다. 다시 말해 . P(Joe and Mary say blue|car is blue)=P(Joe says blue|car is blue)P(Mary says blue|car is blue)
Luca Citi

15
@Glen_b : 세상에는 파란색과 파란색이 아닌 두 가지 색상 만 있습니다. 분명히 둘 다 다양한 색조, 특히 파란색이 아닙니다.
psmears

13

1000 개의 의견이 체계적인 편견을 공유하지 않는다는 중요한 가정이 있습니다. 이것은 합리적인 가정이지만 다른 경우에는 중요 할 수 있습니다.

예를 들면 다음과 같습니다.

  • 그들은 모두 비슷한 색맹을 공유합니다 (예를 들어 인구의 유전학).
  • 그들은 모두 밤에 주황색 나트륨 가로등 아래에서 차를 보았습니다.
  • 그들은 모두 파란색이 금기이거나 마법과 관련이있는 공통 문화를 공유합니다 (어떤 물체를 파란색으로 묘사하는지 또는 문화적 완곡 어 또는 그 밖의 것을 사용하는지의 여부에 상관 없음).
  • 그들은 어떤 특정한 방법으로 대답하지 않거나 대답하지 않으면 그들에게 좋은 / 나쁜 것이 일어날 것이라는 말을 들었습니다.

이 경우에는 가능성이 없지만 다른 경우에는 중요한 암시 적 가정입니다. 극단적 일 필요는 없습니다. 질문을 다른 도메인으로 바꾸면 이것이 실제 요소가 될 것입니다.

귀하의 답변이 공유 편견에 의해 영향을받을 수있는 각 예 :

  • 키가 얇은 유리가 실제로 동일한 짧은 지방 유리보다 더 많은 것을 보유하고 있는지 물어보십시오. 그러나 1000 명의 응답자는 매우 어린 아이들입니다 (공식 오인).
  • 사다리 아래를 걷는 것이 위험한지 1000 명에게 물어보십시오 (공통적 인 문화적 신념)
  • 1000 명의 결혼 한 사람들에게 파트너가 자신의 답변을 알고 있다고 생각하는 상황에서 파트너를 사랑하거나 바람 피운 적이 있는지 물어보십시오. 상황은 TV 쇼 또는 파트너 등이있을 때 발표 될 수 있습니다 (결과에 대한 상식)

900 : 100 응답이 신념과 정직성의 척도였으며 정답을 가리 키지 않는 구조적으로 동일한 질문을 상상하는 것은 어렵지 않습니다. 이 경우에는 아니지만 다른 경우에는 가능합니다.


11

다른 사람들로부터 다른 답변을 얻는 한 가지 이유는 질문이 다른 방식으로 해석 될 수 있고 여기서 "확률"이라는 의미가 무엇인지 명확하지 않기 때문입니다. 이 문제를 이해하는 한 가지 방법은 마태 스의 대답에서와 같이 베이 즈의 규칙을 사용하여 사전과 이유를 지정하는 것입니다.

확률을 요구하기 전에 랜덤으로 모델링 된 것과 그렇지 않은 것을 결정해야합니다. 알려지지 않았지만 고정 수량을 사전에 할당해야한다는 것은 보편적으로 인정되지 않습니다. 다음은 질문과 관련된 문제를 강조한 유사한 실험입니다.

엑스나는나는=1,,1000=0.5엑스나는나는=11000엑스나는=900


1
따라서 자동차가 파란색이고 나머지는 동일하다는 가정을 제거하면 900 명이 파란색이고 100이 아니라고 가정하면 확률은 0.9가됩니다.
사용자

아니요. 1에 훨씬 더 가깝습니다. 1000 명 중 900 명은 색상이 잘못 될 가능성이 거의 없습니다.
gnasher729

1
the probability is either one or zero, depending on whether the car is actually blue or not.이것은 내가 알고있는 "확률"에 대한 이해와 일치하지 않습니다. "X는 발생할 수 있거나 일어날 수 없으므로 확률은 50 % 여야합니다." 그 문장의 의미를 좀 더 명확하게 할 수 있습니까?
AnoE

2
@AnoE의 구별은 매개 변수와 랜덤 변수의 유사성과 유사합니다. 그것은 자동차가 사실 파란색임을 나타내는 질문의 설정에서 주어지며, 색상은 무작위 실험의 결과가 아닙니다. 본질적으로 빈번한 v. 베이지안 해석입니다. 동전을 1000 번 뒤집고 900 개의 머리를 관찰하면 동전이 공정 할 확률은 얼마입니까? 당신이 빈번한 (또는 무의미한) 사람이라면 그것은 1 또는 0입니다; 우리는 매개 변수에 확률을 할당하지 않습니다.
ekvall

@user 아니요, 요점을보다 명확하게하기 위해 답변을 업데이트했습니다.
ekvall

7

간단한 실제 답변 :

확률은 가정에 따라 0 %에서 100 % 사이의 범위 일 수 있습니다.

기존 답변을 정말 좋아하지만 실제로는 기본적으로 다음 두 가지 간단한 시나리오로 요약됩니다.

시나리오 1 : 사람들은 것으로 가정 매우 가 파란색 일 때 파란색을 인식 ... 0 %에 좋은

이 경우 자동차가 파란색이 아니라고 말한 사람들이 너무 많아서 실제로 파란색이 아닐 가능성이 큽니다. 따라서 확률은 0 %에 가까워집니다.

시나리오 2 : 사람들이 파란색이 아닌 경우 파란색이 아닌 것을 인식 하는 데 매우 능숙 하다고 가정합니다 ... 100 %

이 경우 자동차가 파란색이라고 말한 사람들이 너무 많아 실제로 파란색 일 가능성이 큽니다. 따라서 확률은 100 %에 가까워집니다.


물론 수학적인 관점에서이 문제를 겪게 될 것입니다. '관련 확률이 ...이라고 가정하자'와 같은 일반적인 것으로 시작합니다. 이는 일반적으로 임의의 상황에 대해 알려지지 않았으므로 의미가 없습니다. 그러므로 나는 단순하고 현실적인 가정으로 두 백분율을 쉽게 정당화 할 수 있고 따라서 의미있는 답이 하나도 없다는 생각을 이해하기 위해 극단을 바라 보라고 주장한다.


2
"사람들이 파란색 인식에 매우 능숙하다고 가정 할 경우"시나리오 1에없는 경우 왜 파란색으로 추정됩니까? 위양성 및 위음성 측면에서 시나리오를 표현할 수 있습니다.
하이드

@hyde은 모호성을 제거하기 위해 시나리오를 수정했습니다
데니스 Jaheruddin에게


5

추정 프레임 워크를 개발해야합니다. 몇 가지 질문은

  1. 몇 가지 색상이 있습니까? 우리는 두 가지 색상을 이야기하고 있습니까? 아니면 무지개의 모든 색?

  2. 색상이 얼마나 뚜렷합니까? 우리는 파란색과 주황색으로 이야기하고 있습니까? 아니면 청색, 청록색, 청록색?

  3. 파란색이라는 것은 무엇을 의미합니까? 청록색 및 / 또는 청록색은 파란색입니까? 아니면 그냥 파란색?

  4. 이 사람들은 색상을 얼마나 잘 평가합니까? 그들은 모두 그래픽 디자이너입니까? 아니면 색맹입니까?

순전히 통계적인 관점에서, 우리는 마지막 것에 대해 약간의 추측을 할 수 있습니다. 첫째, 우리는 적어도 10 %의 사람들이 잘못된 답변을 선택하고 있음을 알고 있습니다. 첫 번째 질문에서 두 가지 색상 만 있다면, 우리는

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

빠른 점검으로, 그것들을 합하면 100 %가됩니다. @MatthewDrury 답변 에서 더 수학적 표기법을 볼 수 있습니다 .

세 번째 90 %는 어떻게 얻습니까? 많은 사람들이 파란색으로 말했지만 그렇지 않은 경우 잘못되었습니다. 두 가지 색상 만 있기 때문에 대칭입니다. 두 가지 이상의 색상이 있다면, 다른 것을 말할 때 잘못된 선택의 기회는 더 낮을 것입니다.

어쨌든,이 추정 방법은 우리에게 90 % 파랑을줍니다. 여기에는 81 %의 사람들이 파란색이라고 말할 때와 9 %의 사람들이 그렇지 않다고 말할 때가 있습니다. 이것은 아마도 우리가 원래의 질문에 대답 할 수있는 가장 가까운 것이며 아마도 두 가지 다른 것을 추정하기 위해 데이터에 의존해야합니다. 그리고 파란색이 선택 될 가능성은 파란색이 정확할 가능성과 같다고 가정합니다.

두 개 이상의 색상이 있으면 로직이 약간 변경됩니다. 처음 두 줄은 동일하게 유지되지만 마지막 두 줄의 대칭성을 잃습니다. 이 경우 더 많은 입력이 필요합니다. 우리는 파란색을 81 %로 다시 올릴 확률을 다시 예상 할 수 있지만 누군가가 그렇지 않다고 말할 때 색상이 파란색 일 가능성은 무엇인지 모릅니다.

우리는 또한 두 가지 색상 추정을 향상시킬 수 있습니다. 각 색상의 통계적으로 상당한 수의 자동차를 고려할 때 통계적으로 상당한 수의 사람들이 자동차를보고 분류 할 수 있습니다. 그런 다음 각 색상을 선택할 때 사람들이 얼마나 자주 올바른지, 각 색상 선택에 대해 얼마나 자주 올바른지 계산할 수 있습니다. 그러면 사람들의 실제 선택에 따라 더 정확하게 추정 할 수 있습니다.

90 %가 어떻게 잘못 될 수 있는지 물을 수 있습니다. 푸른 색, 파란색 및 사파이어의 세 가지 색상이 있으면 어떻게되는지 고려하십시오. 누군가이 세 가지를 모두 파란색으로 합리적으로 고려할 수 있습니다. 그러나 우리는 더 많은 것을 원합니다. 우리는 정확한 그늘을 원합니다. 그러나 누가 다른 그늘의 이름을 기억합니까? 많은 사람들이 그들이 아는 유일한 일치하는 그늘이기 때문에 파란색을 추측 할 수 있습니다. 그리고 그것이 푸른 것으로 밝혀 질 때 여전히 잘못입니다.


이전 의견 중 하나에서 언급했듯이 반드시 두 가지 관련 색상 만 '파란색'과 '파란색 아님'이므로 여러 색상에 대한 부분이 필요하지 않습니다.
Dennis Jaheruddin

4

제공 한 정보로 정확한 수학적 참 / 거짓 확률을 계산할 수 없습니다 .

그러나 실제로는 이러한 정보를 확실하게 사용할 수 없습니다. 따라서 우리의 직관 (그리고 우리가 내기면 내 돈이 어디로 갈 것인지)을 사용 하면 차는 분명히 파란색입니다. (일부는 이것이 더 이상 통계가 아니라고 생각하지만 과학에 대한 흑백 견해는별로 도움이되지 않습니다)

추론은 간단하다. 차가 파란색이 아니라고 가정하십시오. 그런 다음 90 %의 사람들 (!)이 틀 렸습니다. 다음과 같은 문제 목록으로 인해 잘못되었을 수 있습니다.

  • 색맹
  • 병적 인 거짓말
  • 알코올, LCD 등과 같은 물질의 영향을 받고있는
  • 질문을 이해하지 못한다
  • 다른 형태의 정신 장애
  • 위의 조합

위의 수치는 평균 무작위 인구의 90 %에 영향을 미치지 않을 것이므로 (예 : 색맹은 남성의 약 8 %, 여성의 0.6 %, 즉 1000 명 중 43 명) 영향을 미칩니다. 푸른. (내 돈은 어쨌든 갈 것입니다).


이것은 직관적으로 나에게 맞는 것 같습니다. 나는 원래의 질문에 대한 비판이 충분한 정보를 제공하지 못하고 어떤 가정이 이루어져야한다고 생각한다.
Pat Molloy

@PatMolloy 정확한 옳고 그름의 복잡한 수학 답변을 제공하기에 충분한 정보를 제공하지 않습니다 (이 사이트에서 얻는 많은 질문이 확실합니다). 그러나 줄어든 정보를 감안할 때, 돈을 베팅 할 때 사람들이 선택하는 답 (100 %)입니다.
luchonacho

1
나는 당신이 가장 그럴듯한 대안 중 일부를 다루지 못했다고 생각합니다. 결론은 당신이 결론을 수정하도록해야합니다. 여기에는 (a) 사람들이 파란색을 인식 할 수 없습니다. (b) 질문자와 응답자 사이에 "파란색"에 대한 일반적인 이해가 없다. (c) "파란색"의 "과학적인"의미는 사람들이 일반적으로 "파란색"으로 이해하는 것과 다릅니다. 중요한 것은, 당신 이 이러한 대안들 중 어느 것도 열거 하지 않은 것들을 정량화 할 수 없기 때문에 , 답의 확률을 정량화하는 방법을 어떻게 정당화 할 수 있습니까? 그것은 통계가 아닙니다!
whuber

"위의 내용은 평균 무작위 인구의 90 %에 영향을 미치지 않을 것"이라고 확신하지 마십시오. 우리는 일반적으로 인간을 논의 할 때 평균적인 관점에서 이야기한다는 것을 기억하십시오. 따라서, 평균에 비해 색맹이 소수에 불과하지만 테트라 크로 마츠와 같이 시력이 우수한 사람은 거의 없습니다.
NPSF3000

2
나는 항상 LCD의 영향을 받고 있습니다
Alex

2

나는 수십억 마리의 파리가 틀릴 수 없다는 사실에 근거하여 대변을 먹지 않을 것입니다. 1000 명 중 900 명이 차량이 파란색이라고 생각하기 위해 속인 이유는 수십 가지가있을 수 있습니다. 결국, 그것은 마술의 기초이며 사람들이 현실에서 제거 된 것을 생각하게합니다. 만약 1000 명 중 900 명이 조수를 찌르는 마술사를 보게되면, 조수는 찌르는 소리로 무대에서 살인 사건이 어떻게 발생했는지 즉시 알게 될 것입니다. 반사 자동차 페인트에 파란 빛이 있습니까?


2

설문 조사자는 질문에 정확하게 답변하기 위해 설문 조사가 수행 된 방법에 대해 너무 잘 알지 못합니다. 그가 우려하는 한 여론 조사는 몇 가지 문제로 고통받을 수 있습니다.

여론 조사에 참여한 사람들은 편견이있을 수 있습니다.

  1. 자동차 착시 때문에 파랗게 보였습니다 .

  2. 차의 색깔은 어떤 이유로 관찰하기 어려웠으며, 사람들은 어떤 이유로이 차 전에 많은 파란 차를 보았 기 때문에 대부분의 사람들은이 차가 아마도 파란 차라고 생각했습니다.

  3. 당신은 차가 파란색이라고 말하도록 지불했습니다.

  4. 차가 파란색이라고 믿도록 누군가에게 최면을가했습니다.

  5. 그들은 여론 조사를 거짓말로하고 방해하기 위해 협정을 맺었습니다.

설문 조사에 참여한 사람들 사이에는 그들이 선택되는 방식이나 서로 영향을 미치기 때문에 상관 관계가있을 수 있습니다.

  1. 같은 종류의 색맹 인 사람들을 대상으로 한 대량 회의에서 실수로 여론 조사를 실시했습니다.

  2. 당신은 유치원에서 설문 조사를 수행했습니다; 소녀들은 차에 관심이 없었고 대부분의 소년들은 파란색을 좋아하는 색으로 보았으므로 차가 파란색이라고 상상했습니다.

  3. 차를 보여준 첫 번째 사람은 술에 취해 파란색으로 보인다고 생각하고 "IT IS BLUE"를 외쳤다.

따라서 설문 조사가 올바르게 수행 된 경우 자동차가 파란색 일 확률은 매우 높지만 (Ruben van Bergen의 답변에 설명 된대로) 설문 조사의 신뢰성이 손상되어 자동차가 파란색이 아닐 가능성이 있습니다 의미 없는. 설문 조사자가이 기회를 예상 할 수있는 정도는 궁극적으로 환경이 여론 조사와 관련이있을 가능성과 여론 조사를 얼마나 잘 수행하고 있는지 (그리고 그가 얼마나 잘못 생각하는지)에 대한 그의 추정에 달려 있습니다.


2

"blue"정의

문화와 언어에 따라 파란색 개념이 다릅니다. IIRC, 일부 문화권은 파란색 개념 안에 녹색을 포함합니다!

다른 자연어와 마찬가지로, "파란색"이라고 부르는시기와 그렇지 않은시기에 대한 문화적 협약이 있다고 가정 할 수 있습니다.

전반적으로 언어의 색상은 놀랍도록 주관적입니다 (@Count Ibilis 덕분에 아래 주석의 링크).

여기에 이미지 설명을 입력하십시오


7
질문의 맥락에서, 나는이 특정 측면이 매우 관련이 없다고 생각합니다. OP는 사람들이 확신 할 수없는 "azure", "torqouise"등과 같은 것이 아니라 매우 일반적인 용어로 "blue"라는 단어를 선택했다고 가정합니다. 또한 자동차는 일반적으로 가능한 / 일반 색상의 매우 제한된 팔레트를 사용하는 경향이 있습니다. 마지막으로, 질문은 "100 명이 왜 파란색이 아닌 것으로 말했는지"가 아니라 "차가 실제로 파란색 일 확률"입니다.
AnoE


정확한 정의는 "현재 환경 조건에서 475nm + 마이너스 ~ 10-20nm의 파장을 갖는 빛을 주로 조사합니다". 일반적으로 파란색으로 허용됩니다.
rackandboneman

그렇습니다. 그러나 주 파장을 측정하기 위해 얼마나 많은 사람들이 도구를 가지고 다닙니 까? 또한 보이지 않는 파장을 제외하는 것을 잊었습니다.
Anony-Mousse

1
문제는 통계적으로 알려지지 않은 캘리브레이션 그룹을
파장계

1

좀 더 세련된 전제 조건에 따라 가능성은 몇 가지 다른 값이 될 수 있지만 99.995 %가 나에게 가장 합리적입니다.

우리는 정의상 자동차가 파란색 (100 %)이라는 것을 알고 있지만 이것이 실제로 의미하는 바 (정확하지는 않을 것임)는 명확하지 않습니다. 파란 색으로 볼 수 있다는 의미에서 파란색으로 가정합니다.

또한 테스트 대상의 90 %가 파란색으로보고했습니다.

우리는하지 않습니다 질문을 받았다 알고 또는 평가는 수행 된 방법, 어떤 조명 조건 차가 존재가 색상 이름을 물었다.에 있었다, 일부 피사체 인해 조명 조건에 "푸른 녹색"과 평가자가 수 말했다 예를 들어, 수 "파란색"으로 계산하지 않았습니다. 질문이 "이 파란색입니까?"인 경우 동일한 사람들이 "예"라고 대답했을 수 있습니다. 테스트 대상을 악의적으로 속이려는 의도가 아니라고 가정합니다.

우리는 tritanopy의 발생률이 약 0.005 %라는 것을 알고 있습니다. 이는 자동차 가 실제로 파란색으로 보일 수 있다면 시험 대상자의 99.995 %가 실제로 색상을 파란색으로 보았 음을 의미 합니다. 그러나 테스트 대상의 9.995 %가 파란색을 분명하게 볼 때 파란색을보고하지 않았다는 것을 의미합니다. 그들은 그들이 본 것에 대해 거짓말을했습니다. 이것은 당신의 인생 경험이 당신에게 말하는 것과 비슷합니다. 사람들은 항상 정직하지는 않습니다 (그러나 동기가 없다면, 보통 있습니다).

따라서 관찰하지 않는 사람은 차가 파란색이라고 압도적으로 확신 할 수 있습니다. 100 %

예외적으로 관찰하지 않는 사람이 삼 자극을 앓고있는 경우를 제외하고는 다른 모든 사람 (또는 그중 90 %)이 그렇게 말하더라도 차를 파란색으로 보지 않을 것입니다. 여기에 다시 철학이 생깁니다. 만약 다른 사람들이 나무가 떨어지는 소리를 들었지만, 그렇지 않았다면 떨어 졌습니까?

다음, 비 관찰하는 사람이 trianope (0.005 %의 확률)로 발생하는 경우 : 내가 가장 합리적인, 실제적인 대답이 될 것이라고 아마 ... 일 것 확인 예측 색상과 본-실제 색상이 같은 거짓 얻을 것이다 있는지. 따라서 가능성은 100 %가 아니라 99.995 %입니다.

또한 보너스로 테스트 대상자의 9.995 %가 거짓말 쟁이임을 알았고 모든 크레타 인이 거짓말 쟁이 임을 알았 으므로 크레타에 있지 않다고 결론 내릴 수 있습니다!


1

당신은 파란 차를 가지고 있습니다 (일부 객관적인 과학적 방법으로-그것은 파란색입니다).

...

"차가 파란색 일 확률은 얼마입니까?"

100 % 파란색입니다.

그들이 아는 것은 900 명이 파란색이라고 말하고 100 명은 그렇지 않다는 것입니다. 이 사람들에 대해 더 이상 아무것도 모른다 (1000).

문맥에 상관없이이 숫자를 사용하는 것은 전혀 말이 되지 않습니다 . 그것은 모두 질문에 대한 개인적인 해석으로 귀결됩니다 . 우리는이 길을 따라 가서 Wittgenstein 's를 사용해서는 안된다 : "Wovon man nicht sprechen kann, darüber muss man schweigen."


비교를 위해 다음 질문을 상상해보십시오.

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

이것은 기본적으로 동일한 (정보가 적음) 문제이지만 자동차의 색상에 대한 생각은 대부분 (완전하지는 않지만) 정황이라는 것이 훨씬 분명합니다.


장기적으로 여러 관련 질문을 받으면 불완전한 질문에 대한 답을 추측 할 수 있습니다. 단일 사례 에서는 작동하지 않지만 장기적으로 작동 하는 tat-for-tat 알고리즘과 동일 합니다 . 같은 의미에서, Wittgenstein은 그의 초기 조사 에서 그의 주요 조사 에서 돌아왔다 . 이러한 질문에 답변 할 수 있지만 자세한 정보 / 시험 / 질문이 필요합니다. 과정입니다.


0

만약 우리가 차가 파란색이라고 가정하면, 파란색이 아니라고 1,000 명 중 100 명이 어떤 종류의 극단적 인 샘플 편향을 의미합니다. 아마도 당신은 색맹 인 사람들 만 샘플링했을 것입니다. 우리가 차가 파란색이 아니라고 가정하면 샘플 바이어스는 더욱 악화됩니다. 우리가 주어진 데이터에서 결론을 내릴 수있는 것은 샘플이 매우 편향되어 있다는 것입니다. 그리고 어떻게 편향되는지 알지 못하므로 자동차의 색상에 대해서는 아무것도 결론을 내릴 수 없습니다.


음, 분명히 900 명의 사람들이 그것이 파란색이라고 말했다는 사실은 뭔가 좋은 것입니까? 파란색이 아닌 것보다 더 가능성이 있다고 결론 내릴 수 없습니까? 응답자는 900과 100의 숫자 만 알고 있다는 것을 기억하십시오. 그래서 그들은 실제로 편견에 대해 말할 수 있습니까?
Pat Molloy

0

몇 가지 답변이 있습니다. 나는 결코 수학 전문가가 아니지만 여기에 내 것이 있습니다.

네 가지 가능성 만있을 수 있습니다.

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

이 질문에서 사례 1과 사례 4의 합은 900 명 (90 %)이고 사례 2와 사례 3의 합은 100 명 (10 %)입니다. 그러나 여기에 캐치가 있습니다. 당신이 모르는 것은이 두 경우 쌍 내 분포입니다. 사례 1과 4의 합계가 사례 1 (자동차가 파란색임을 의미)로 구성되거나 전체 합계가 사례 4 (자동차가 파란색이 아님)로 구성 될 수 있습니다. 사례 2 + 3의 합도 같습니다. 그래서 ... 필요한 것은 사례 합계 내 분포를 예측할 수있는 방법을 생각해내는 것입니다. 질문에 다른 표시가 없으면 (사람들이 자신의 색이나 그와 비슷한 것을 알고 있다고 80 % 확신한다고 말하는 곳은 없습니다) 확실하고 확실한 대답을 얻을 수있는 방법은 없습니다.

이것을 말하면서 ... 나는 예상되는 대답이 다음 줄에 있다고 생각합니다.

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

나머지 50 %가 단순히 알려지지 않은 경우 오류 마진이라고합니다.


0

엑스,와이1,와이2,,와이1000{0,1}1(엑스)엑스와이나는|엑스=11와이나는|엑스=00θ=(엑스,0,1)

(θ,엑스|와이1:1000)(θ)(엑스|θ)나는=11000(와이나는|엑스) . 이와 같이 공식화하면 (적어도 베이지안 인 경우)이 세 가지 매개 변수에 대해 사전을 선택해야한다는 사실이 강조됩니다. 베이지안 관점은 차가 얼마나 자주 파란 지에 대해 알고있는 것과 현실에 동의하는 사람들의 경향에 대해 알고있는 것을 활용할 수 있기 때문에 좋습니다.

{엑스나는}{와이나는|엑스}


-3

차를 볼 수없는 사람은 자동차가 과학적으로 파란색임을 증명하지 못합니다. 차가 파란색 일 확률은 50/50입니다 (파란색이거나 그렇지 않습니다). 다른 사람들을 폴링하면이 사람의 의견에 영향을 줄 수 있지만 보이지 않는 자동차가 파란색인지 아닌지에 대한 가능성은 바뀌지 않습니다.

위의 모든 수학은 샘플 세트가 파란색인지 여부를 결정할 수있는 확률을 결정합니다.


파란색 일 확률이 50/50이라는 것이 확실하지 않습니다. 실제로 빨강, 흰색, 노랑 등일 수 있기 때문에 50 미만입니다. 무작위로 선택한 자동차가 파란색 일 확률은 50 % 미만입니다.
사용자
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.