교사와 사려 깊은 학생 사이의 대화
이 실에는 지금까지 크레용이 충분하지 않다는 믿음으로 겸손하게 제출했습니다. 간략한 설명 된 시놉시스가 끝에 나타납니다.
학생 : p- 값은 무엇을 의미합니까? 많은 사람들이 통계 가 "표본 평균보다 크거나 같은 평균을 볼 확률" 또는 "이 결과를 관찰 할 확률은 ... 귀무 가설이 참일 때" 또는 "내 표본의 통계치" 에 동의하는 것 같습니다 . "시뮬레이션 된 분포에 떨어졌다" 고 심지어 "널 귀무 가설이 참이라고 가정 할 때 계산 된 통계량보다 큰 테스트 통계를 관찰 할 확률"도 있습니다.
교사 : 모든 상황에서 모든 진술은 정확합니다.
학생 : 나는 그들 대부분이 얼마나 관련이 있는지 모르겠습니다. 귀무 가설 과 대립 가설 해야 한다고 습니까? 그들은 이러한 아이디어에 어떻게 "보다 크거나 같음"또는 "적어도 큰 것"또는 매우 인기있는 "더 극단적 인 것"에 관여합니까?H AH0HA
교사 : 일반적으로 복잡해 보일 수 있으므로 구체적인 예를 살펴 보는 데 도움이 되겠습니까?
학생 : 물론 이죠. 그러나 가능하면 현실적이면서도 간단한 것으로 만드십시오.
교사 :이 가설 검정 이론은 역사적으로 관측 오류를 분석하기 위해 천문학 자의 필요성으로 시작되었으므로 어떻게 시작해야할까요. 나는 어느 날 과학자가 자신의 장치에서 측정 오류를 줄이려는 노력을 묘사 한 오래된 문서를 살펴 보았습니다. 그는 알려진 위치에서 별을 많이 측정하고 그 위치 앞뒤로 변위를 기록했습니다. 이러한 변위를 시각화하기 위해, 그는 약간 부드럽게 할 때와 같이 히스토그램을 그렸습니다.
학생 : 히스토그램의 작동 방식을 기억합니다. 세로 축에는 "밀도"라는 레이블이 붙어있어 측정의 상대 주파수 가 높이가 아닌 영역 으로 표시됩니다 .
교사 : 맞습니다. "비정상적인"또는 "극단적 인"값은 면적이 아주 작은 지역에 있습니다. 여기 크레용이 있습니다. 총 면적의 10 분의 1에 해당하는 지역에서 색칠 할 수 있다고 생각하십니까?
학생 : 물론입니다. 쉽습니다. [그림의 색상.]
교사 : 아주 좋아요! 그것은 그 지역의 약 10 %처럼 보입니다. 그러나 히스토그램에서 중요한 부분은 수직선 사이의 영역이라는 점을 기억하십시오 . 변위가 수평 축의 해당 선 사이에 위치 할 가능성 또는 확률 을 나타냅니다 . 즉, 바닥까지 끝까지 채색해야하고 면적의 절반 이상이 될 것입니까?
학생 : 아, 알겠습니다. 다시 시도하겠습니다. 커브가 실제로 낮은 곳에서 색칠하고 싶습니다. 두 끝에서 가장 낮습니다. 한 영역에서만 색칠해야합니까, 아니면 여러 부분으로 나눌 수 있습니까?
교사 : 여러 부분을 사용하는 것이 현명한 생각입니다. 그들은 어디에 있습니까?
학생 (포인팅) : 여기와 여기. 이 크레용은 그리 선명하지 않기 때문에 펜을 사용하여 사용중인 선을 보여줍니다.
교사 : 아주 좋아요! 이야기의 나머지 부분을 말씀 드리겠습니다. 과학자는 장치를 약간 개선 한 다음 추가 측정을 수행했습니다. 그는 첫 번째 변위가 단지 이라고 썼는데 이는 좋은 신호라고 생각했지만 신중한 과학자이기 때문에 더 많은 측정을 확인했습니다. 불행히도, 다른 측정 값은 손실됩니다-이 시점에서 원고가 끊어집니다. 우리가 가진 모든 것은 그 단일 숫자 입니다.0.10.10.1
학생 : 너무 나빠요. 그러나 당신의 숫자에서 변위의 넓은 확산보다 훨씬 좋지 않습니까?
교사 : 그것이 당신이 대답하고 싶은 질문입니다. 우선 으로 무엇을 배치해야 합니까?H0
학생 : 회의론자는 장치의 개선이 전혀 효과가 없는지 궁금합니다. 증거의 부담은 과학자에게있다 : 그는 회의론자가 틀렸다는 것을 보여주고 싶었다. 그것은 귀무 가설이 과학자에게는 좋지 않다고 생각합니다. 우리가 알고 있는 의 값을 포함한 모든 새로운 측정 은 첫 번째 히스토그램에 설명 된대로 작동해야한다고 말합니다 . 아니면 그보다 더 나빠질 수도 있습니다.0.1
교사 : 계속하세요.
학생 : 그리고 대안은 새로운 측정이 덜 확산되는 것입니다. 맞습니까?
교사 : 아주 좋아요! 스프레드가 적은 히스토그램이 어떻게 보이는지 그림으로 그려 주시겠습니까? 첫 번째 히스토그램의 다른 사본이 있습니다. 그 위에 참조로 그릴 수 있습니다.
학생 (도면) : 펜을 사용하여 새 히스토그램의 개요를 표시하고 그 아래 영역에서 채색합니다. 수평축에서 대부분의 곡선이 0에 가까워졌고 그 영역의 대부분이 0의 (가로) 값에 가까워졌습니다.
교사 : 좋은 시작입니다. 그러나 확률 을 표시하는 히스토그램 의 총 면적은 이어야합니다 . 따라서 첫 번째 히스토그램의 총 면적은 입니다. 새 히스토그램 내부의 면적은 얼마입니까?111
학생 : 반이하라고 생각합니다. 나는 그것이 문제라는 것을 알지만 그것을 고치는 방법을 모른다. 어떻게해야합니까?
교사 : 비결은 전체 히스토그램을 이전보다 높게 만들어 전체 면적이 이되도록하는 것 입니다. 여기에서는 설명하기 위해 컴퓨터 생성 버전을 보여 드리겠습니다.1
학생 : 나는 본다 : 수직으로 뻗어 모양이 실제로 바뀌지 않았지만 이제는 빨간색 영역과 회색 영역 (빨간색 아래 부분 포함)의 양이 같습니다.
교사 : 맞습니다. 당신은 귀무 가설의 사진을보고있다 (파란색, 확산) 및 부분 (이하 확산과 빨간색으로) 대체 가설.
학생 : 대안의 "부분"은 무엇을 의미합니까? 그것은 단지 아닌가 대립 가설?
교사 : 통계 학자와 문법은 섞이지 않는 것 같습니다. :-) 진지하게, "가설"이 의미하는 바는 일반적으로 완전히 큰 가능성입니다. 여기서 대안은 (이전에 언급했듯이) 측정이 이전보다 "확산되지 않는"것입니다. 그러나 얼마나 덜 ? 많은 가능성이 있습니다. 여기, 다른 것을 보여 드리겠습니다. 노란색 대시로 그렸습니다. 이전 두 사이에 있습니다.
학생 : 알다시피 : 당신은 다른 양의 스프레드를 가질 수 있지만 그 스프레드가 실제로 얼마나 될지 미리 알 수 없습니다. 그러나이 그림에서 왜 재미있는 음영을 만들었습니까?
교사 : 히스토그램의 차이점과 위치를 강조하고 싶었습니다. 대체 히스토그램이 null보다 낮은 곳에서는 회색 으로, 대안이 높은 곳에서는 빨간색으로 음영 처리했습니다 .
학생 : 왜 그럴까요?
교사 : 양쪽 꼬리에서 첫 번째 히스토그램을 어떻게 채색했는지 기억하십니까? [논문을 보면서.] 아, 여기 있습니다. 이 그림을 같은 방식으로 색칠합시다.
학생 : 나는 기억합니다 : 그것들은 극단적 인 가치입니다. 나는 널 밀도가 가능한 한 작고 10 %가 채색 된 곳을 발견했다.
교사 : 그 극한 지역의 대안에 대해 말해주세요.
학생 : 크레용이 뒤덮었 기 때문에보기 힘들지만, 내가 색칠 한 영역에 대안이있을 가능성이 거의없는 것 같습니다. 히스토그램은 가치 축에 대해 바로 아래에 있으며 그 아래 영역이 없습니다.
교사 : 그 생각을 계속합시다. 가설 적으로, 측정 값이 의 변위를 가지고 있다고 말하고이 3 가지 히스토그램 중 가장 히스토그램 중 어느 것이 가장 좋았 는지 선택하도록 요청했습니다.−2
학생 : 첫 번째는 파란색입니다. 그것은 가장 널리 퍼져 있으며 가 발생할 가능성이있는 유일한 곳 입니다.−2
교사 : 그리고 원고 의 값은 어떻습니까?0.1
학생 : 흠 ... 그것은 다른 이야기입니다. 3 개의 히스토그램은 모두 에서 매우 높습니다 .0.1
교사 : 알겠습니다. 충분합니다. 그러나 그 값이 과 사이 와 같이 근처에 있다고 가정 해 봅시다 . 이 그래프에서 확률을 읽는 데 도움이됩니까?0 0.20.100.2
학생 : 물론 이죠. 지역을 사용할 수 있기 때문입니다. 과 사이의 각 곡선 아래 면적을 추정해야합니다 . 그러나 그것은 꽤 어려워 보입니다.0.200.2
교사 : 당신은 그렇게 멀리 갈 필요가 없습니다. 어느 지역이 가장 큰지 알 수 있습니까?
학생 : 물론 가장 높은 곡선 아래에있는 것. 세 영역 모두 같은베이스를 가지므로 커브가 클수록 그 아래와베이스 아래에 더 많은 영역이 있습니다. 즉, 가장 큰 막대 그래프 (내가 빨간 대시로 그린 막대 그래프)는 의 변위에 가장 적합합니다 . 난 당신이 함께 어디로 가는지 볼 생각하지만, 나는 조금 걱정 : 내가 볼 필요가 없습니다 모든 의 히스토그램 모든 대안, 단지 하나 또는 두가 여기에 표시하지? 어떻게하면 될까요?0.1
교사 : 패턴을 잘 따를 수 있습니다. 측정 장치가 더욱 정교 해지면 히스토그램은 어떻게됩니까?
학생 : 점점 좁아지고 키도 커야하므로 전체 면적이 동일하게 유지됩니다. 따라서 히스토그램을 비교하기가 매우 어렵습니다. 대안은 모두 에서 null 오른쪽보다 높습니다 . 그러나 다른 가치에서는 때때로 대안이 더 높고 때로는 더 낮습니다! 예를 들어, [ 근처의 값을 가리키고 ] 바로 여기에서 내 빨간 히스토그램이 가장 낮고 노랑 히스토그램이 가장 높으며 원래의 널 히스토그램이 그 사이에 있습니다. 그러나 오른쪽에는 널이 가장 높습니다.3 / 403/4
교사 : 일반적으로 히스토그램을 비교하는 것은 복잡한 일입니다. 이를 돕기 위해 컴퓨터에 다른 플롯을 만들도록 요청했습니다 . 대체 히스토그램 높이 (또는 "밀도")를 널 히스토그램 높이 로 나누고 "우도 비율"이라는 값을 만듭니다. 결과적으로 보다 큰 값 은 대안이 더 가능성이 높고 보다 작은 값 은 대안이 덜 가능성이 있음을 의미합니다. 그것은 또 다른 대안을 이끌어 냈습니다. 다른 두 가지보다 더 널리 퍼져 있지만 원래 장치보다 여전히 덜 퍼져 있습니다.111
교사 (계속) : 대안이 널보다 가능성이 높은 곳을 보여줄 수 있습니까?
학생 (컬러링) : 여기 중간에 있습니다. 그리고 이것은 더 이상 히스토그램이 아니기 때문에 우리는 면적이 아닌 높이를 봐야한다고 생각합니다. 그래서 나는 가로 축에 값의 범위를 표시하고 있습니다. 그러나 중간 정도의 색상을 어떻게 알 수 있습니까? 어디서 색칠을 멈춰요?
교사 : 확실한 규칙은 없습니다. 그것은 우리가 결론을 어떻게 사용할 것인지와 회의론자들이 얼마나 격렬한가에 달려 있습니다. 그러나 앉아서 당신이 성취 한 것에 대해 생각 : 당신은 지금 큰 우도 비율이 결과는 증거 실현 을위한 작은 가능성의 비율이 대안 및 결과 증거 에 대한 대안. 가능한 한 귀무 가설 하에서 발생할 가능성이 적고 대안 하에서 상대적으로 발생할 가능성이 높은 영역에서 색칠하는 것이 좋습니다. 대화를 시작할 때 되돌아온 첫 번째 다이어그램으로 돌아가서 널 끝에있는 두 개의 꼬리는 "익스트림"이기 때문에 채색되었습니다. 그들은 여전히 좋은 일을합니까?
학생 : 그렇게 생각하지 않습니다. 비록 그것들이 귀무 가설 하에서는 극도로 극도로 희귀했지만 대체 방법으로는 불가능합니다. 만약 나의 새로운 측정치가 이라고한다면 회의론자 편에 서서 이 어떤 경우에도 특이한 결과 였음에도 불구하고 개선이 있었음을 부인할 것이라고 생각 합니다. 나는 그 색을 바꾸고 싶다. 여기, 또 다른 크레용을 갖도록하겠습니다.3.03.03.0
교사 : 그게 뭐죠?
학생 : 우리는 원래 히스토그램 아래에있는 영역의 10 %, 즉 널 (NULL)을 설명하는 영역에 그리도록 요청했습니다. 이제 대안이 더 많이 생길 것 같은 지역의 10 %를 그렸습니다. 새로운 측정이 그 영역에있을 때 우리는 대안을 믿어야한다고 말합니다.
교사 : 그리고 회의론자는 그것에 어떻게 반응해야합니까?
학생 : 회의론자는 자신이 틀렸다는 것을 인정할 필요가 없습니다. 그러나 나는 그의 믿음이 조금 흔들려 야한다고 생각합니다. 결국, 우리는 방금 그린 영역 안에 측정 이 가능 하지만 널이 참일 때 10 %의 확률 만 가질 수 있도록 배열했습니다 . 그리고 대안이 사실 일 때 더 큰 가능성이 있습니다. 과학자가 장치를 얼마나 개선했는지에 달려 있기 때문에 그 기회가 얼마나 큰지 말할 수 없습니다 . 나는 그것이 더 크다는 것을 안다. 따라서 증거는 회의론자에 위배됩니다.
교사 : 알겠습니다 . 배운 내용을 완전히 명확하게 이해할 수 있도록 이해를 요약 해 주시겠습니까?
학생 : 대안 가설을 귀무 가설과 비교하려면 히스토그램을 비교해야한다는 것을 배웠습니다. 우리는 대안의 밀도를 널 (null)의 밀도로 나눕니다. 이것이 바로 "우도 비율"입니다. 좋은 시험을하려면 10 % 나 회의론자를 흔들기에 충분한 양을 골라야합니다. 그런 다음 가능성 비율이 가능한 높은 값을 찾아서 10 % (또는 무엇이든)가 채색 될 때까지 색상을 지정해야합니다.
교사 : 그리고 그 색소를 어떻게 사용하겠습니까?
학생 : 앞서 말씀 드렸듯이, 채색은 세로선 사이에 있어야합니다. 채색 아래에있는 값 (가로 축)은 귀무 가설에 대한 증거입니다. 다른 값들-글쎄, 관련된 모든 히스토그램을 더 자세히 보지 않고 의미가 무엇인지 말하기는 어렵습니다.
교사 : 원고에서 의 가치로 돌아가서 , 무슨 결론을 내립니까?0.1
학생 : 그것은 내가 마지막으로 채색 한 영역 안에 있으므로 과학자가 옳았 고 장치가 실제로 향상되었다고 생각합니다.
교사 : 마지막 것. 결론은 시험의 기준 또는 "크기"로 10 %를 선택하는 것을 기반으로합니다. 많은 사람들이 대신 5 %를 사용하는 것을 좋아합니다. 일부는 1 %를 선호합니다. 그들에게 무엇을 말할 수 있습니까?
학생 : 모든 시험을 한 번에 할 수 없었습니다! 글쎄, 어쩌면 나는 방법으로 할 수 있습니다. 테스트의 크기에 관계없이 에서 채색을 시작해야한다는 것을 알 수 있습니다. 이 의미에서 "가장 극단적 인"값이며 거기서부터 양방향으로 바깥쪽으로 작업합니다. 나는에서 바로 중지한다면 실제로 관찰 고마웠다 값을 - 내가 어딘가 사이의 영역에 착색 한 것이라고 생각 및 , 말 . 5 %와 1 %의 사람들은 내가 너무 많이 색칠했다는 것을 바로 알 수 있습니다. 5 % 나 1 % 만 색칠하고 싶다면 그렇게 할 수는 있지만 만큼 멀지 않습니다.0.1 0.05 0.1 0.08 0.100.10.050.10.080.1. 그들은 내가 한 것과 같은 결론에 이르지 못했을 것입니다. 그들은 실제로 변화가 일어났다는 증거가 충분하지 않다고 말할 것입니다.
교사 : 당신은 처음에 그 모든 인용문들이 실제로 무엇을 의미 하는지 말해주었습니다 . 이 예에서, 더 큰 값을 갖 거나 널 밀도가 작은 값 을 가질 수 있다는 의미에서 "더 극단적"또는 "보다 크거나 같음"또는 "적어도 큰"을 의도 할 수 없다는 것이 명백해야한다 . 그것들은 실제로 당신이 묘사 한 큰 가능성 비율 의 의미에서 이러한 것들을 의미합니다 . 그런데 계산 한 정도의 숫자를 "p- 값"이라고합니다. 상대 히스토그램 높이 분석-가능성 비율과 관련하여 설명 된 방식으로 만 올바르게 이해할 수 있습니다.0.08
학생 : 감사합니다. 나는이 모든 것을 아직 완전히 이해하고 있다고 확신하지 못하지만, 당신은 나에게 많은 생각을 주었다.
교사 : 더 나아가고 싶다면 Neyman-Pearson Lemma를보십시오 . 당신은 아마 지금 그것을 이해할 준비가되어 있습니다.
개요
대화 상자에있는 것과 같은 단일 통계를 기반으로하는 많은 테스트는 " "또는 " "라고합니다. 이것들은 널 히스토그램이 어떻게 보이는지를 암시하는 방법이지만 힌트 일뿐입니다.이 숫자의 이름은 중요하지 않습니다. 여기에 설명 된대로 학생이 요약 한 구성은 p- 값과의 관계를 보여줍니다. p- 값은 의 관측으로 귀무 가설을 기각하게 하는 가장 작은 검정 크기입니다 .t t = 0.1ztt=0.1
세부 사항을 표시하기 위해 확대 된이 그림에서 귀무 가설은 파란색으로 표시되고 두 가지 일반적인 대안은 점선으로 표시됩니다. 이러한 대안이 널보다 훨씬 큰 경향이있는 영역은 음영 처리되어 있습니다. 음영의 대안은 대안의 상대적인 가능성이 가장 큰 곳에서 시작합니다 ( ). 관측치 에 도달 하면 음영이 멈 춥니 다 . p- 값은 널 히스토그램 아래 음영 영역의 영역입니다. 널이 참이라고 가정 할 때 어떤 대안이 참인지에 관계없이 가능성 비율이 큰 결과를 관찰 할 가능성이 있습니다. 특히이 구성은 대립 가설에 밀접하게 의존합니다. 가능한 대안을 지정하지 않으면 수행 할 수 없습니다.t = 0.10t=0.1