다른 서류를 읽을 때 비슷한 질문이있었습니다. 그리고 Education Data Mining 커뮤니티의 질문과 같이 이와 관련된 많은 질문을했습니다.
왜 물류 손실 대신 확률에 제곱 손실을 사용합니까?
여기에 나는 많은 개인적인 의견을 제시 할 것입니다.
많은 실제 사용 사례에서 손실 기능이 그다지 중요하지 않다고 생각합니다. 일부 연구원은 제곱 손실에 대해 더 많이 알고 그 시스템을 구축 할 수 있으며 여전히 작동하며 실제 문제를 해결합니다. 연구자들은 물류 손실이나 힌지 손실을 결코 알지 못하고 시도해 볼 수 있습니다. 또한 최적의 수학 모델을 찾는 데 관심이 없을 수도 있지만 이전에는 아무도 시도하지 않은 실제 문제를 해결하려고합니다.
이것은 또 다른 예입니다. 내 질문에 대한 대답을 확인하면 모두 비슷합니다. 분류에서 다른 손실 함수를 선택하면 약 0-1 손실에 미치는 영향은 무엇입니까?
더 많은 생각 : 기계 학습 연구는 어떤 모델을 선택하고 모델을 최적화하는 방법에 많은 시간을 할애 할 수 있습니다. 이는 머신 러닝 연구원이 더 많은 데이터를 수집하거나 더 많은 측정 값을 얻을 수있는 능력이 없기 때문입니다. 그리고 머신 러닝 연구원의 직업은 특정 실제 문제를 더 잘 해결하지 않고 더 나은 수학을 얻고 있습니다.
반면에 현실에서는 데이터가 더 좋으면 모든 것을 능가합니다. 따라서 신경망 또는 임의의 포리스트를 선택하는 것은 그리 중요하지 않을 수 있습니다. 이러한 모든 모델은 실제 문제를 해결하기위한 도구로 기계 학습을 사용하려는 사람과 유사합니다. 수학이나 도구 개발에 관심이없는 사람은 시스템을 개선하기 위해 특정 도메인 지식을 사용하는 데 더 많은 시간을 할애 할 수 있습니다.
의견에서 언급했듯이. 그리고 수학이 허술하다면 여전히 작동하는 것을 만들 수 있습니다.