베이지안 : "안녕하세요, 기계 학습자!"
상용 주의자 : "안녕하세요, 기계 학습자!"
기계 학습 : "여러분이 능숙하다고 들었습니다. 여기에 몇 가지 데이터가 있습니다."
F : "예, 모델을 적어두고 MLE을 계산해 봅시다."
n−1n
F : "아, 네 생각 나게 해줘서 고마워. 나는 종종 모든 것에 MLE을 사용해야한다고 생각하지만 편견없는 견적 자 등에 관심이있다 ."
ML : "이 철학은 무엇입니까? 도움이 되겠습니까?"
÷(n−1)
ML : "그래서 무엇에 관심이 있습니까?"
F : "평가."
ML : "저 소리가 마음에 들어요."
θθθ
ML : "좋아요! 잦은 사람들은 실용적 인 것 같습니다. 각 블랙 박스를 결과로 판단합니다. 평가가 중요합니다."
F : "사실! 여러분도 비슷한 접근 방식을 취하고 있다는 것을 이해합니다. 교차 검증 또는 무언가? 그러나 그것은 지저분한 것 같습니다."
ML : "지저분합니까?"
F : "실제 데이터에 대한 추정자를 테스트한다는 아이디어는 나에게 위험한 것 같습니다. 사용하는 경험적 데이터에는 모든 종류의 문제가있을 수 있으며 평가에 동의 한 모델에 따라 작동하지 않을 수 있습니다."
θ
F : "예. 평가에 사용한 하나의 데이터 집합 (트레인 및 테스트 데이터가있는 데이터 집합)에서 분석법이 작동했을 수도 있지만 항상 작동 할 것입니다."
ML : "모든 데이터 세트에 대해?"
F : "아니요."
ML : "따라서 내 분석법이 하나의 데이터 세트에서 교차 검증되었습니다. 실제 데이터 세트에서 테스트하지 않았습니까?"
F : "맞습니다."
ML : "그러면 저를 주도하게됩니다! 제 방법은 당신보다 낫습니다. 암의 90 %를 예측합니다. 당신의 '증거'는 전체 데이터 세트가 가정 한 모델에 따라 행동하는 경우에만 유효합니다."
F : "음, 그래요."
θ
F : "그렇습니다. 데이터가 실제로 iid Normal (또는 무엇이든)이 아니라면 내 증거는 쓸모가 없습니다."
ML : "저의 평가는보다 신뢰할 수 있고 종합적입니까? 지금까지 시도한 데이터 세트에서만 작동하지만 최소한 실제 데이터 세트, 사마귀 및 모두입니다. 그리고 '완전히'그리고 당신은 모델 확인과 물건에 관심이있었습니다. "
B : (인터럽트) "안녕하세요. 방해해서 죄송합니다. 다른 문제를 시연하고 개입하는 것을 좋아하지만, 저의 빈번한 동료 분출을 보는 것을 정말 좋아합니다."
F : "우와!"
ML : "좋아요, 아이들. 평가에 관한 것이 었습니다. 견적자는 블랙 박스입니다. 데이터가 들어가고, 데이터가 나옵니다. 평가하는 방법에 따라 견적 자의 승인 또는 비 승인입니다. 우리는 상관하지 않습니다. 사용 된 '레시피'또는 '디자인 원칙'에 대해
F : "그렇습니다. 그러나 어떤 평가가 중요한지에 대한 아이디어는 매우 다릅니다. ML은 실제 데이터에 대한 교육 및 테스트를 수행합니다. 더 광범위하게 적용되는 증거가 있기 때문에 더 일반적인 평가를 수행합니다. 더 제한적입니다 (귀하의 데이터 세트가 실제로 평가를 설계 할 때 사용하는 모델링 가정에서 도출 된 것인지 알 수 없기 때문에 ")
ML : "B는 어떤 평가를 사용하십니까?"
F : (개론 자) "이봐. 나를 웃게 만들지 마. 그는 아무것도 평가하지 않는다. 그는 단지 주관적인 신념을 사용하고 그것과 함께 실행한다."
B : "이것은 일반적인 해석입니다. 그러나 선호하는 평가로 베이지안을 정의하는 것도 가능합니다. 그런 다음 우리는 블랙 박스에있는 것을 신경 쓰지 않고 다른 평가 방법에만 신경을 쓴다는 생각을 사용할 수 있습니다."
B는 계속한다 : "고전적인 예 : 의학적 검사. 혈액 검사의 결과는 긍정적이거나 부정적입니다. 빈번한 사람들은 건강한 사람들, 어떤 비율이 부정적인 결과를 얻는 지에 관심이있을 것입니다. 그리고 마찬가지로, 아픈 사람들의 비율은 어느 정도입니까? 잦은 주의자는 고려중인 각 혈액 검사 방법에 대해 이들을 계산 한 후 최고 점수를 얻은 검사를 사용하도록 권장합니다. "
F : "정확합니다. 무엇을 더 원하세요?"
B : "긍정 테스트 결과를 얻은 사람들은 어떻습니까? 그들은 '긍정적 인 결과를 얻는 사람들, 얼마나 많은 사람들이 아플 것입니까?' 그리고 '부정적인 결과를 얻는 사람들 중 얼마나 많은 사람들이 건강합니까?' "
ML : "그렇습니다. 더 좋은 질문을하는 것 같습니다."
F : "HERESY!"
B : "여기 다시갑니다. 그는 어디로 가는지 좋아하지 않습니다."
ML : "이것은 '우선 순위'에 관한 것입니까?"
F : "EVIL".
B : "어쨌든, 그렇습니다. ML입니다. 병에 걸린 긍정적 인 결과 사람들의 비율을 계산하려면 두 가지 중 하나를 수행해야합니다. 하나의 옵션은 많은 사람들에 대해 테스트를 실행하고 예를 들어, 그 사람들 중 몇 명이이 병으로 죽어 가는가. "
ML : "그것이 내가하는 것처럼 들린다. 기차와 테스트를 사용하라."
B : "하지만 인구의 질병 비율에 대해 기꺼이 가정한다면이 수치를 미리 계산할 수 있습니다. 잦은 운동가는 사전에 계산을 수행하지만이 인구 수준의 질병률을 사용하지는 않습니다."
F : "발견되지 않은 가정."
B : "오, 닥쳐. 일찍, 당신은 알아 냈어. ML은 당신이 다른 사람처럼 근거없는 가정을 좋아한다는 것을 발견했다. 당신의 '증명 된'커버리지 확률은 모든 가정이 일어나지 않는 한 현실 세계에 쌓이지 않을 것입니다. 왜 저의 이전 가정이 그렇게 다른가? 당신은 나를 미쳤다고 생각하지만, 당신의 가정은 보수적이고 견고하며 가정이없는 분석의 일이라고 가정합니다. "
B (계속) : "어쨌든 ML, 말했듯이 베이지안은 다른 종류의 평가를 좋아합니다. 관찰 된 데이터를 조정하고 그에 따라 추정기의 정확도를 계산하는 데 더 관심이 있습니다. 사용하지 않고는 이 평가 를 수행 할 수 없습니다. 그러나 흥미로운 점은 일단 이러한 형태의 평가를 결정하고 사전을 선택한 후에는 적절한 견적을 생성 할 수있는 자동 '레시피'를 가지고 있다는 것입니다. 복잡한 모델에 대한 편견없는 추정기는 적절한 추정기를 구축 할 수있는 자동화 된 방법이 없습니다. "
ML : "그렇습니다. 자동 견적 도구를 만들 수 있습니까?"
B : "예. 편견이 추정기를 평가하는 나쁜 방법이라고 생각하기 때문에 편견없는 추정량을 자동으로 생성 할 수있는 방법이 없습니다. 그러나 조건부 데이터 추정이 마음에 들었습니다. "나에게 견적을 제공 할 수있는 이전과 가능성을 연결할 수 있습니다."
ML : "어쨌든, 요약하자. 우리는 방법을 평가할 수있는 다른 방법이 있으며, 어떤 방법이 가장 좋은지에 대해서는 결코 동의하지 않을 것이다."
B : "글쎄, 그건 공평하지 않다. 우리는 그것들을 섞어서 일치시킬 수있다. 만약 우리 중 누구라도 좋은 교육 자료를 가지고 있다면, 우리는 아마도 그것에 대해 테스트해야한다. 그리고 일반적으로 우리는 가능한 많은 가정을 테스트해야한다. "일부 입증 된 데이터 생성 모델에서 성능을 예측하는 증거도 재미있을 것입니다."
F : "그렇습니다. 평가에 대해 실용적이 되겠습니다. 실제로 무한 샘플 특성에 대한 집착을 멈추겠습니다. 과학자들에게 무한 샘플을 주도록 요청했지만 여전히 그렇게하지 않았습니다. 유한 한 샘플에 다시 집중할 시간입니다. "
ML : "마지막 질문이 하나 있습니다. 분석법 을 평가 하는 방법에 대해 많은 논란이 있었지만 어떻게 분석법 을 작성 합니까 ?"
B : "아. 초기에 갈수록 베이지안은 더 강력한 일반적인 방법을 가지고 있습니다. 복잡 할 수도 있지만, 우리의 후부에서 추출 할 일종의 알고리즘 (순수한 MCMC)을 항상 작성할 수 있습니다. "
F (개별) : "하지만 편견이있을 수 있습니다."
B : "그렇습니다. MLE가 종종 편향되어 있다는 사실을 상기시켜 주어야합니까? 때로는 편견이없는 추정기를 찾기가 어려우며 심지어 어리석은 추정기가있는 경우 (일부 복잡한 모델의 경우) 분산은 음수입니다. 그리고 당신은 그것을 편견이라고 부릅니다. 편견입니다, 예. 그러나 유용합니다!
ML : "OK guys. 당신은 다시 뛰고 있습니다. 질문 하나하겠습니다. F. 당신은 같은 문제에 대해 작업했을 때 당신의 방법의 바이어스와 B의 방법의 바이어스를 비교 한 적이 있습니까?"
F : "예. 사실 인정하기는 싫지만 B의 접근 방식은 때때로 내 추정기보다 낮은 편향과 MSE를 갖습니다 !"
ML : "여기서의 교훈은 평가에 대해서는 약간 동의하지 않지만, 원하는 속성을 가진 추정기를 만드는 방법에 대한 독점은 없습니다."
B : "예, 우리는 서로의 작업을 조금 더 읽어야합니다. 견적 담당자에게 서로에게 영감을 줄 수 있습니다. 다른 사람의 견적 담당자는 우리 자신의 문제에 대해 즉시 사용할 수 있습니다."
F : "나는 편견에 대한 집착을 그만 두어야한다. 편견없는 추정자는 어리석은 차이가있을 수있다. 나는 우리 모두가 평가 방법과 평가자에서보고자하는 속성에 대한 선택에 대해 '책임'을 가져야한다고 생각한다. 우리는 철학을 뒷받침 할 수 없습니다. 당신이 할 수있는 모든 평가를 시도하십시오. 그리고 나는 견적 자들을위한 새로운 아이디어를 얻기 위해 베이지안 문학을 계속 몰래 볼 것입니다! "
B : "사실, 많은 사람들이 자신의 철학이 무엇인지 실제로 알지 못합니다. 나 자신도 확실하지 않습니다. 베이지안 레시피를 사용하고 좋은 이론적 결과를 증명한다고해서 잦은 주의자입니까? 잦은 주의자는 성능에 대한 위의 증거에 신경을 쓰지만 레시피는 신경 쓰지 않으며, 대신 훈련 (또는 테스트)을한다면 기계 학습 자라는 의미입니까? "
ML : "그럼 우리 모두 비슷해 보인다."