Nate Silver의 저서 The Signal and the Noise에서 그는 다음을 씁니다. 질문에 대한 통찰력을 제공 할 수 있습니다.
예측의 가장 중요한 테스트 중 하나는 이것이 가장 중요한 것 중 하나라고 주장합니다-교정이라고합니다. 비가 올 확률이 40 %라고 말한 시간 중 실제로 비는 얼마나 자주 발생 했습니까? 장기적으로 약 40 %의 비가 내렸다면 예측이 잘 조정되었다는 의미입니다. 대신 20 % 나 60 %의 비가 내렸다면 그렇지 않았습니다.
그래서 이것은 몇 가지 포인트를 발생시킵니다. 우선, 당신이 올바르게 지적했듯이, 당신은 당신이 예측하는 사건의 결과에 의해 단일 예측의 품질에 대해 어떤 추론을 할 수 없습니다. 최선의 방법은 많은 예측 과정에서 모델의 성능을 확인하는 것입니다.
고려해야 할 또 다른 사항은 Nate Silver가 제공하는 예측은 이벤트 자체가 아니라 이벤트의 확률 분포라는 것입니다. 따라서 대통령 선거의 경우 클린턴, 트럼프 또는 존슨이 경주에서 이길 확률 분포를 추정하고 있습니다. 따라서이 경우 그는 다항 분포를 추정합니다.
그러나 그는 실제로 훨씬 더 세밀한 수준에서 레이스를 예측하고 있습니다. 그의 예측은 각 후보자가 각 주에서 얻을 수있는 투표율의 확률 분포를 추정합니다. 따라서 우리가 3 개의 후보를 고려한다면, 이것은 길이 51 * 3의 랜덤 벡터로 특성화 될 수 있으며 [0, 1] 구간의 값을 취하는데, 상태 내 비율에 대한 비율의 합은 1로 제한됩니다. 51은 다른 50 개 주와 DC이기 때문에 (그리고 실제로는 일부 주가 선거 대학 투표를 나눌 수 있기 때문에 실제로 몇 개 더 있다고 생각합니다.) 숫자 3은 후보자 수 때문입니다.
이제 당신은 그의 예측을 평가할 데이터가 많지 않습니다-그는 내가 알고있는 마지막 3 선거에 대해서만 예측을 제공했습니다 (더 있었습니까?). 따라서 실제로 모델을 가지고 있고 시뮬레이션 된 데이터를 사용하여 모델을 평가할 수 없다면 모델을 공정하게 평가할 방법이 없다고 생각합니다. 그러나 여전히 당신이 볼 수있는 흥미로운 것들이 있습니다. 예를 들어, 그가 선거에서 일주일 등 특정 시점에서 주별 투표 비율을 얼마나 정확하게 예측했는지를 보는 것이 흥미로울 것이라고 생각합니다. 예를 들어 1 주일, 1 개월, 6 개월, 1 년 등 여러 시점에 대해이 작업을 반복하면 그의 예측에 대해 꽤 흥미로운 설명을 제공 할 수 있습니다. 한 가지 중요한 경고 : 결과는 선거 내에서 각 주에 걸쳐 높은 상관 관계가 있으므로 51 개의 주 * 3 개의 선거 독립 예측 사례가 있다고 말할 수 없습니다 (예 : 모델이 한 주에서 후보 성과를 과소 평가하는 경우 다른 주에서도 과소 평가되는 경향이 있음) . 그러나 어쨌든 나는 이것을 의미있는 것으로 할 수있는 충분한 데이터를 가질 수 있도록 이것을 그렇게 생각할 것입니다.