한 가지 가능성이 있습니다.
교사의 성과 평가는 전통적으로 어려웠습니다. 이 어려움의 한 부분은 다른 학생들이 주어진 과목에 대해 다른 관심 수준을 가지고 있다는 것입니다. 주어진 학생이 A를받는다고해서 반드시 교육이 훌륭하다는 것을 의미하지는 않습니다. 오히려 매우 재능 있고 관심이 많은 학생이 교육 수준이 좋지 않더라도 성공하기 위해 최선을 다했음을 의미 할 수 있습니다. 반대로, D를받는 학생이 반드시 교육 수준이 낮다는 것을 의미하는 것은 아닙니다. 오히려 교육과 영감을주기위한 교사의 최선의 노력에도 불구하고 무관심한 학생이 해안을 떠 났음을 의미 할 수 있습니다.
학생 선택 (따라서 학생들의 관심 수준)이 무작위 적이 지 않다는 사실로 인해 어려움이 악화됩니다. 학교는 다른 과목보다 한 과목 (또는 과목 그룹)을 강조하는 것이 일반적입니다. 예를 들어, 학교는 인문학보다 기술 과목을 강조 할 수 있습니다. 그러한 학교의 학생들은 아마도 기술 분야에 관심이 많기 때문에 최악의 교사라도 합격 점수를받을 것입니다. 따라서 수학을 전공하는 학생들의 비율은 가르치는 데있어 좋은 척도가 아닙니다. 우리는 훌륭한 교사들이 배우고 싶어하는 학생들보다 훨씬 더 잘할 것으로 기대합니다. 반대로, 같은 학생들은 예술에 전혀 관심이 없을 수도 있습니다. 모든 학생들이 A를받을 수 있도록 최선을 다하는 교사조차 기대하기 어려울 것입니다.
또 다른 어려움은 주어진 수업의 모든 성공이 해당 수업의 교사에게 직접 기인 한 것은 아닙니다. 오히려, 학교 (또는 전체 학군)가 성취를위한 동기 부여와 틀을 만들어서 성공했을 수 있습니다.
이러한 모든 어려움을 고려하기 위해 연구원들은 교사의 '부가가치'를 평가하는 모델을 만들었습니다. 본질적으로이 모델은 각 학생의 고유 한 특성 (전체 관심 수준 및 학습 성공)과 학교 및 학군의 학생 성공 기여도를 고려하고 '평균'으로 예상되는 학생의 성적을 예측합니다. 그 환경에서 가르치기. 그런 다음이 모델은 실제 성적을 예측 된 점수와 비교하고이를 바탕으로 다른 모든 고려 사항을 고려했을 때 교육이 적절한 지, 적합한 지 또는 더 나은지를 결정합니다. 모델이 비 수학자에게는 복잡해 보일 수 있지만 실제로는 매우 단순하고 표준입니다. 수학자들은 수십 년 동안 유사하고 더 복잡한 모델을 사용해 왔습니다.
요약하면 Isaacson의 추측은 맞습니다. 66 명의 학생 중 65 명의 학생이 주 시험에서 능숙하게 점수를 받았지만, 개가 교사 인 경우에도 동일한 점수를 얻었을 것입니다. 실제로 좋은 교사는 이러한 학생들이 동일한 시험에서 '숙련'뿐만 아니라 실제로 '좋은'점수를 달성 할 수있게합니다.
이 시점에서 나는 모델에 대한 나의 관심사를 언급 할 수있다. 예를 들어, 모델 개발자는 교육 품질을 평가하는 데 어려움이 있다고 주장합니다. 그들을 믿을만한 충분한 이유가 있습니까? 소득이 낮은 지역은 예상되는 '지구'및 '학교'점수가 낮아집니다. 이웃의 예상 점수가 2.5라고 가정합니다. 평균 3 점을 달성하는 교사는 좋은 평가를받습니다. 이것은 교사들이 4 또는 5의 점수보다는 3의 점수를 목표로하도록 자극 할 수있다. 다시 말하면, 교사들은 완벽보다는 평범 성을 목표로 할 것이다. 우리는 이것이 일어나기를 원합니까? 마지막으로, 모델은 수학적으로 단순하지만 인간의 직관과는 매우 다른 방식으로 작동합니다. 결과적으로, 우리는 모델을 검증하거나 이의를 제기 할 명백한 방법이 없습니다. ' 결정. Isaacson의 불행한 예는 이것이 무엇을 이끌어 낼 수 있는지를 보여줍니다. 우리는 그렇게 중요한 일에 컴퓨터에 맹목적으로 의존하고 싶습니까?
이것은 평신도에 대한 설명입니다. 나는 여기서 논란의 여지가있는 몇 가지 문제를 회피했다. 예를 들어, 저소득층 인구가있는 학군이 평신도에게는 좋지 않기 때문에 실적이 저조 할 것으로 예상하고 싶지 않습니다.
또한 목표는 실제로 모델에 대해 합리적으로 공정한 설명을 제공하는 것이라고 가정했습니다. 그러나 이것이 NYT의 목표가 아니라고 확신합니다. 그래서 그들의 설명이 좋지 않은 이유의 적어도 일부는 제 생각에 의도적 인 FUD입니다.