이야기 :
할머니는 걸어가지만 올라가지 않습니다. 어떤 할머니들은 그렇습니다. 한 할머니는 킬리만자로 등반하는 것으로 유명했습니다 .
그 휴화산 은 크다. 받침대 위로 16,000 피트입니다. (제국을 싫어하지 마십시오.) 때때로 빙하가 맨 위에 있습니다.
빙하가없는 해에 오르면 정상에 도착하면 빙하가있는 것과 같은 정상입니까? 고도가 다릅니다. 취해야 할 길은 다릅니다. 빙하 두께가 더 클 때 상단으로 가면 어떻게 되나요? 그것이 더 많은 업적을 이루나요? 매년 약 35,000 명이 등반을 시도 하지만 약 16,000 명만이 성공합니다.
응용 :
그래서 나는 할머니에게 체중 조절 (일명 모델 복잡성을 최소화)을 설명 할 것입니다.
할머니, 당신의 두뇌는 당신이 그것을 알고 있든 없든 놀라운 사상가입니다. 16,000 명 중 얼마나 많은 사람들이 실제로 정상에 도달했다고 생각하면 "모두"라고 말할 것입니다.
3 만 명의 클라이머의 신발에 센서를 설치하고 해발 높이를 측정하면 그 사람들 중 일부는 다른 사람만큼 높지 않아 자격이 없을 수도 있습니다. 내가 할 때 나는 일정한 모델로 갈 것입니다-높이가 측정 된 최대 높이의 백분위 수와 같지 않다면 최고가 아닙니다. 어떤 사람들은 정상에 뛰어 오른다. 어떤 사람들은 그냥 길을 건너 앉습니다.
센서에 위도 및 경도를 추가하고 고차 방정식을 적용하고 더 잘 맞을 수 있으며 더 많은 사람들을 수용 할 수 있으며, 시도하는 총 사람들의 정확히 45 %를 차지할 수도 있습니다.
내년은 어떤 화산이 지구의 알베도 를 실제로 변화시키기 때문에 "큰 빙하"년 또는 "빙하없는"년이라고 가정 해 봅시다 . 올해부터 복잡하고 정확한 모델을 가져와 내년에 올라가는 사람들에게 적용하면 모델이 이상한 결과를 낳을 것입니다. 어쩌면 모든 사람이 "통과"하거나 너무 높아서 통과 할 수도 있습니다. 아마 아무도 통과하지 못할 것이며, 실제로 아무도 등반을 완료하지 않았다고 생각할 것입니다. 특히 모델이 복잡한 경우 잘 일반화되지 않는 경향이 있습니다. 올해의 "훈련"데이터에 정확히 맞을 수 있지만 새로운 데이터가 올 때 제대로 작동하지 않습니다.
토론 :
모형의 복잡성을 제한하면 일반적으로 과적 합없이 더 나은 일반화를 수행 할 수 있습니다. 더 단순한 모델을 사용하면 실제 변형을 수용하도록 더 빌드 된 모델은 더 나은 결과를 제공하는 경향이 있습니다.
이제 네트워크 토폴로지가 고정되어 있으므로 "내 매개 변수 수는 고정되어 있습니다"라는 말이 있습니다. 모델 복잡도에는 변화가 없습니다. 무의미한 말. 무게의 엔트로피를 측정하십시오. 엔트로피가 높을 때 일부 계수는 다른 계수보다 실질적으로 더 많은 "정보"를 가지고 있음을 의미합니다. 엔트로피가 매우 낮 으면 일반적으로 계수가 비슷한 수준의 "정보"를 나타냅니다. 정보가 반드시 좋은 것은 아닙니다. 민주주의에서 당신은 모든 사람들이 평등하기를 원하고, 조지 오웰과 같은 것들이 "다른 사람들보다 평등하다"는 것은 시스템의 실패의 척도입니다. 그럴만한 이유가 없다면, 가중치가 서로 비슷하게되기를 원합니다.
개인적으로 : 부두 나 휴리스틱을 사용하는 대신, "정보 기준"과 같은 것들을 선호합니다. 왜냐하면 그들은 신뢰할 수 있고 일관된 결과를 얻을 수 있기 때문입니다. AIC , AICc 및 BIC 는 일반적이고 유용한 시작점입니다. 솔루션의 안정성 또는 정보 기준 결과 범위를 결정하기 위해 분석을 반복하는 것이 일반적인 접근 방식입니다. 무게의 엔트로피에 천장을 두는 것을 볼 수 있습니다.