매월 수준에서 행동 예측을 제공하는 여러 가지 다른 모델을 평가하고 싶습니다. 데이터는 균형이 잡히고 100,000이고 T = 12입니다. 결과는 주어진 달에 콘서트에 참석하므로 한 달에 ~ 80 %의 사람들에게는 0이지만, 무거운 사용자의 긴 꼬리가 있습니다. 내가 예측 한 결과는 결과의 카운트 특성을 존중하지 않는 것 같습니다. 분수 콘서트가 만연합니다.
나는 모델에 대해 아무것도 모른다. I는 단지 6 개의 블랙 박스 예측 관찰 Y 1 , . . . , Y (6) 한달에 각 사람. 나는 모델 제작자들이 추정을 위해 가지고 있지 않은 여분의 데이터를 가지고 있지만 (콘서트 참가자는 동일하게 유지되지만) 정확성과 정확성 측면에서 각각의 성능을 측정하고 싶습니다. 예를 들어, 일부 모델은 잦은 콘서트 참가자에게는 잘 예측되지만 소파 감자에게는 실패합니까? 1 월 예측이 12 월 예측보다 낫습니까? 또는 정확한 크기를 신뢰할 수없는 경우에도 예측을 통해 실제 측면에서 사람들의 순위를 올바르게 지정할 수 있다는 점을 알고 있으면 좋을 것입니다.
첫 번째 생각은 예측 및 시간 인형에 대한 실제의 고정 효과 회귀 분석을 실행하고 각 모델에 대한 RMSE 또는 를 살펴 보는 것이 었습니다 . 그러나 RMSE를 부트 스트랩하지 않는 한 각 모델의 위치 또는 차이점이 중요한지에 대한 질문에는 대답하지 않습니다. 결과의 분포는 또한이 접근법에 대해 걱정합니다.
두 번째 아이디어는 결과를 0, 1-3 및 3+로 묶고 혼동 행렬을 계산하는 것이었지만 12 개를 만들지 않으면 시간 차원을 무시합니다. 또한 꽤 거칠다.
concord
TJ Steichen과 NJ Cox 의 Stata 명령 을 알고 있습니다.이 by()
옵션 에는 옵션이 있지만 데이터를 연간 총계로 축소해야합니다. 이것은 다른 유용한 통계 중에서도 신뢰 구간 이있는 Lin의 일치 상관 지수 를 계산 합니다. CCC는 -1에서 1까지이며 1과 완벽하게 일치합니다.
이 문제를 어떻게 해결 하시겠습니까? 예측에 일반적인 MAPE와 같은 통계 계산을 제안 하시겠습니까?
지금까지 유용한 것들 :
- Lin의 일치도 상관 계수의 반복 측정 버전 슬라이드