시험 결과가 이항입니까?


31

다음은 간단한 통계 질문입니다. 나는 그것을 이해하지 못한다.

X = 시험에서 획득 한 포인트의 수 (복수 선택과 정답은 1 포인트) X 이항 분포가 있습니까?

교수의 대답은 다음과 같습니다.

그렇습니다. 정답이나 오답 만 있기 때문입니다.

내 대답 :

아니요. 각 질문마다 "성공 가능성"이 다르기 때문에 p. 내가 이항 분포를 이해 한 것처럼 일련의 베르누이 실험은 각각 주어진 성공 확률 p (및 p와 관련하여 "동일한")로 간단한 결과 (성공 또는 실패)를 갖습니다. 예를 들어, (공정한) 동전을 100 번 뒤집 으면, 이것은 베르누이 실험 100 개이며 모두 p = 0.5입니다. 그러나 여기서 질문은 다른 종류의 p를 가지고 있습니까?


14
+1 요점 :이 시험이 실제로 시험이 아닌 한, 질문에 대한 답변은 서로 밀접한 관련이 있습니다. 경우 총 점수입니다 개인을위한, 이것은 이항 분포를 배제됩니다. 모든 수험자가 독립적으로 그리고 무작위 적으로 모든 답을 추측하는 "널 가설"가정 하에서 질문이 운영되고있을 가능성이 있습니까? X
whuber

2
역설적으로, 나는 이것에 대한 부분적인 신용을 위해 적어도 로비를했을 것이지만, "답변"은 그것을 수여하기 위해 탈퇴를 반영하는 것 같습니다 :) (여기서 당신이 여기 있다고 생각합니다).
AdamO

1
예, 감사합니다. D : 포아송 이항 분포가 더 많다고 생각합니다
Paul


2
나는 질문이 좋지 않다는 것에 모두 동의하지만, 여기에 프레임 문제가 있습니다. 이것이 초등 코스이고 짧은 답변 형식 인 경우 (추론을 설명 할 수있는 기회가된다면) 가장 좋은 대답은 아마도 "그렇습니다 (각 질문마다 독립성과 동등한 어려움을 가정)"입니다. 그것은 교수에게 (1) 질문의 한계를 이해하고 (2) 현명한 엉덩이가 되려고하지 않는다는 신호입니다.
벤 볼커

답변:


25

나는 당신의 대답에 동의합니다. 일반적으로 이런 종류의 데이터는 오늘날 어떤 종류의 항목 응답 이론 모델로 모델링됩니다. 예를 들어 Rasch model 을 사용한 경우 이진 응답 는 다음과 같이 모델링됩니다.Xni

Pr{Xni=1}=eβnδi1+eβnδi

여기서 은 번째 개인 능력으로, 는 번째 질문 난이도 로 생각할 수 있습니다 . 따라서이 모델을 사용하면 사람마다 능력이 다르고 질문이 어렵다는 사실을 파악할 수 있으며 이것이 가장 간단한 IRT 모델입니다. n δ i iβnnδii

귀하의 교수 답변은 모든 문제가 "성공"의 확률이 같고 독립성이 있다고 가정합니다. 이항 법은 번의 Bernoulli 시험 의 합계의 분포이기 때문 입니다. 위에서 설명한 두 가지 종류의 종속성은 무시합니다.n

의견에서 알 수 있듯이 특정 사람의 답변 분포를 보았을 때 (따라서 사람 간 변동에 신경 쓰지 않아도 됨) 같은 항목에 대해 다른 사람의 답변을 보았을 때 항목 변동성), 분포는 포아송-이항 분포, 즉 비 -iid 베르누이 시행 의 합의 분포가 됩니다. 분포 이항 또는 푸 아송 으로 근사 할 수 있지만 그게 전부입니다. 그렇지 않으면 당신은 iid 가정을하고 있습니다.n

추측에 대한 "널 (null)"가정 하에서도 추측 패턴이 없다고 가정하므로 사람들은 추측 방식이 다르지 않고 항목 추정 방식이 다르지 않으므로 추측은 순전히 무작위입니다.


말이 되네요! 비록 당신이 질문의 성공 확률의 확률을 계산할 수 있다고 생각하지만 "개인 능력"은 어렵게 들립니다. 예를 들어, 2 개의 질문이 있으므로 2 개의 성공 확률 p1과 p2가 있다고 말할 수 있습니다. 유사하게 2 개의 변수 X1 및 X2 카운팅 (따라서 2 개의 버 눌리 실험). 예를 들어 총 점수 1을 얻을 확률은 P (X1 = 1) * P (X2 = 0) + P (X1 = 0) * P (X2 = 1) = p1 (1-p2) + (p1입니다. -1) p2. 합리적으로 들립니까?
Paul

2
@p가 다른 두 Bernoulli의 폴 합계는 Poisson-binomial입니다.
Tim

4
"널 (null)"가정은 기본적으로 구형 소입니다. 소가 얼마나 구형인지 항상 정확하게 알 수 있습니다.
Hong Ooi

5

이 문제에 대한 답은 질문의 구성과 정보를 얻는시기에 따라 다릅니다. 전반적으로, 나는 교수와 동의하는 경향이 있지만 그의 대답에 대한 설명은 좋지 않으며 교수의 질문에는 더 많은 정보가 포함되어야한다고 생각합니다.

무한한 수의 시험 문제를 고려하고 1 번 문제에 대해 무작위로 하나를 그리고 2 번 문제에 대해 무작위로 하나를 그립니다. 그런 다음 시험에 들어갑니다.

  1. 각 질문에는 두 가지 결과가 있습니다 (옳고 그름)
  2. 정해진 횟수의 시험이 있습니다 (질문)
  3. 각 시험은 독립적으로 고려 될 수있다 (질문이 들어가, 당신의 확률 얻기의 오른쪽 질문 하나에 갈 때와 동일합니다 그것을)p

이 프레임 워크에서 이항 실험의 가정이 충족됩니다.

아아, 잘못 제안 된 통계적 문제는 시험뿐만 아니라 실제로 매우 일반적입니다. 교수님의 이론적 근거를 변호하는 데 주저하지 않습니다.


Jea 저도 맞습니다. 정보가 거의 제공되지 않기 때문에 두 가지 방식으로 논쟁 할 수 있기 때문에 문제는 "나쁜"것입니다. 그러나 나는 교수님의 대답에 매우 만족했습니다.
Paul

4
@Paul, 좋은 통계적 질문을 작성하는 것은 실제로 매우 어렵습니다. 나는 여러 번 그것을 펄럭 였다는 것을 안다.
복직 모니카

1
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.-시험 문제는 잠재적 인 문제 풀과 독립적으로 도출된다는 가정을 명시 적으로 작성해야한다고 생각합니다. 질문 1이 쉬운 경우, 쉽게 시험을 볼 수 있고 질문 2는 쉬울 것입니다.
Adrian

0

n 개의 질문이 있고 확률 p로 하나의 질문에 올바르게 대답 할 수 있고 모든 질문에 대답 할 시간이 충분하며이 테스트를 100 회 수행 한 경우 점수는 평균 np로 정규 분포가됩니다.

그러나 테스트를 100 번 반복하는 것이 아니라 100 개의 다른 후보자가 각각 자신의 확률 p를 갖는 하나의 테스트를 수행하는 것입니다. 이 p의 분포는 가장 중요한 요소가 될 것입니다. 피험자를 잘 연구했다면 p = 0.9, 그렇지 않은 경우 p = 0.1, 0.1과 0.9 사이의 사람은 거의없는 테스트를 할 수 있습니다. 점의 분포는 0.1n과 0.9n에서 매우 강한 최대 값을 가지며 정규 분포와 거의 일치하지 않습니다.

반면에 모든 사람이 어떤 질문 에든 대답 할 수있는 테스트가 있지만 다른 시간이 걸리므로 일부는 n 개의 질문에 모두 답변하고 다른 사람은 시간이 없어서 더 적은 답변에 답합니다. 후보의 속도가 정규 분포라고 가정 할 수 있으면 점이 정규 분포에 가깝습니다.

그러나 많은 테스트에는 의도적으로 매우 어렵고 쉬운 몇 가지 질문이 포함되어 있기 때문에 최고 후보자 (어떤 질문에 대해서는 어느 정도 어려움까지 답변 할 것임)와 최악의 후보자 (아주 대답 만 할 수있는 사람)를 구별 할 수 있습니다. 간단한 질문). 이것은 점의 분포를 상당히 강하게 바꿀 것입니다.


2

2
@Tim 정규 분포에 불필요하게 의존하고 100 번의 시험을 치르는 수수께끼에도 불구하고,이 답변은 특정 사례가 명백하게 비 이항 분포를 초래할 수있는 방법을 보여 주려는 장점이 있습니다. 따라서 이러한 기술적 문제가 해결되면 답변에 귀중한 기여를 할 수 있습니다.
whuber

0

여기서 문제는 우리가 합리적으로 가정 할 수 없기 때문에 발생합니다

  • 12
  • 이 있습니까 독립 . 많은 시험에서 이전 질문에 대한 답변을 바탕으로 작성된 질문을합니다. 이 질문의 시험에서 그런 일이 일어나지 않을 것이라고 누가 말할까요? 시험 문제에 대한 답변을 서로 독립적으로 만들 수없는 다른 요소가 있지만, 이것이 가장 직관적이라고 생각합니다.

통계 문제 클래스에서 시험 문제를 이항으로 모델링하는 질문을 보았지만 다음과 같이 구성되어 있습니다.

모든 질문에 네 가지 선택이 있고 시험을 보는 학생이 모든 답을 무작위로 추측하는 객관식 시험에서 정답의 수를 모형화 할 확률 분포는 무엇입니까?

이 시나리오에서는 물론 이항 분포로 표시됩니다.=14


사실에는 아무 문제가 없지만 논리는 잘못 되었습니다. 어떤 경우에도 (논리적으로) 분포가 여전히 이항적일 수 있기 때문에 일부 가정이 유지되지 않을 수 있음을 입증하는 것으로 충분하지 않습니다 . 또한 이러한 가정이 점수 분포가 확실히 이항 적이 지 않은 방식으로 실패 할 수 있음을 입증해야합니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.