"모델 학습"이라는 용어는 어디에서 유래 되었습니까?


10

종종 데이터 마이너가이 용어를 사용한다고 들었습니다. 분류 문제를 다루는 통계 학자로서 저는 "분류기를 훈련 시키십시오"라는 용어에 익숙하며 "모델을 배우십시오"라는 말도 같은 의미라고 생각합니다. "분류기를 훈련 시키십시오"라는 용어는 신경 쓰지 않습니다. 훈련 데이터를 사용하여 모델 매개 변수의 양호하거나 "향상된"추정값을 얻는 데 모델을 적합시키는 아이디어를 나타내는 것 같습니다. 그러나 배운다는 것은 지식을 얻는 것을 의미합니다. 평범한 영어로 "모델을 배우십시오"는 그것이 무엇인지 아는 것을 의미합니다. 그러나 실제로 우리는 모델을 "알지"않습니다. 모델은 실제와 비슷하지만 정확한 모델은 없습니다. "모델이 맞지 않지만 일부는 유용합니다."라고 Box와 같습니다.

데이터 마이너 응답을 듣고 싶습니다. 이 용어는 어떻게 시작 되었습니까? 당신이 그것을 사용한다면, 왜 그것을 좋아합니까?


재미있는 점은 "모델 학습"은 최대 "모든 매개 변수 기억"을 의미하므로 "학습"이 좋은 단어인지 논쟁하지 않더라도 잘못됩니다. 제 언어 (pl)에서 공식적인 명칭은 "모델을 가르치는 것"이지만 "기계 학습"은 "기계 학습"이 아닌 "기계 학습"이라고합니다.

사이드 바 : Box 견적에 대한 참조가 있습니까?
엔트로피

답변:


8

그 기원은 인공 신경망 연구 커뮤니티에 있다고 생각합니다. 신경망은 우리가 배우는 인간의 뇌에서 발생하는 것과 비슷한 방식으로 시냅스 가중치를 수정하여 데이터 모델을 학습하는 것으로 생각할 수 있습니다 경험. 나의 연구 경력은 인공 신경 네트워크에서 시작되었으므로 때로는이 문구를 사용합니다.

아마도 정신 모델이 일련의 매개 변수만큼 뇌의 식별 가능한 물리적 구성 요소가 아닌 것과 같은 방식으로 모델이 방정식이 아닌 모델의 매개 변수로 인코딩 된 것으로 생각하면 더 의미가 있습니다. 뉴런의 일부 설정.

정신 모델이 반드시 옳다는 의미는 없습니다!


1
내 연구의 선두 주자 나는이 토론을했고, 여기이 토론에 관한 질문 게시 stats.stackexchange.com/questions/43559/...을 . 모델 피팅, 교육, 추정 및 학습은 특정 형태의 모델을 정의하는 최상의 매개 변수를 찾기 위해 일부 최적화 방법을 적용한다는 것을 이해하게되었습니다.
엔트로피

6

이 용어는 인공 지능에서 상당히 오래되었습니다. 그의 1950 년 "학습 기계"에 긴 부분을 헌신 튜링 컴퓨팅 기계 및 지능 종이 마음 , 그리고 질적으로지도 학습을 스케치. Rosenblatt의 원본 논문 : The Perceptron : 1958 년 뇌에서 정보 저장 및 조직을위한 확률 모델 : "수학적 학습 모델"에 대해 광범위하게 이야기합니다. 여기에서 퍼셉트론은 "학습 모델"이었다. 모델은 "학습"되지 않았습니다.

Pitts and McCullough 1943 논문 (원본 "신경망"논문)은 실제로 학습에 관심이 없었습니다. 힐버트 (Hilbert) 나 겐젠 (Gentzen) 시스템과 같은 논리적 미적분학을 구성 할 수있는 방법에 관한 것이 었습니다. 추론을 수행 할 수 있습니다. 저는이 전통에서 학습의 상징적 개념과는 반대로 수치를 소개 한 "퍼셉트론 (Perceptrons)"논문이라고 생각합니다.

기계가 예제에서 체스를하는 방법을 배울 수 있습니까? 예. 체스 게임을위한 모델이 있습니까? 예. 최적의 모델입니까 (있는 경우)? 거의 확실하지 않습니다. 평범한 영어로 체스를 할 수 있다면 "체스를 배웠습니다". 내가 최적의 체스 플레이어라는 의미는 아닙니다. 이것은 튜링이 자신의 논문에서 체스 학습에 관해 이야기 할 때 "학습"을 묘사 한 의미입니다.

사용하는 용어와 일치하지 않습니다. 따라서 (예를 들어) 극한의 학습에 대해서는 "identify"라고 말하고, SVM- 학습에 대해서는 "train"이라고 말하지만 MCMC- "learning"에 대해서는 "optimize"라고 말합니다. 예를 들어 나는 단지 회귀를 "회귀"라고 부릅니다.


내 질문은 분류에서 학습이라는 용어를 사용하는 것이 아니라 "모델 학습"이라는 문구에 관한 것이 었습니다. 기계 학습은 매우 친숙하지만 "모델 학습"은이 사이트에서 처음으로 들었던 문구입니다.
Michael R. Chernick

나는 거기에 약간의 애매함을 추가했지만 당신이 옳습니다. 이것은 좋은 대답이 아닙니다. "모델"에 대한 많은 토론없이 학습에 착수했습니다. 오늘 내가 기억할 수있는 것이 있는지 살펴볼 것이지만, 아무 것도 염려하지 않으면 오늘 저녁에 제거 할 수 있습니다.
Patrick Caldon

이 답변을 삭제하려고했지만 분명히 몇 사람이 좋아했습니다! 나는이 맥락에서 "학습"이라는 용어가 어디에서 나오는지에 대한 합리적인 작은 시놉시스 인 것 같아요.
Patrick Caldon

+1 나는 질문의 요점을 조금 벗어나도 관련이 있고 흥미롭고 3 개의 공감대를 얻었 기 때문에 공감대를주고있다. 보관하십시오.
Michael R. Chernick

2

Bioplausible Machine Learning의 연구원으로서, 나는 "모델이 맞지 않지만 일부는 유용하다"는 사실에 동의하며, 실제로 모델과 형식주의는 문제의 최적화에 대해 이야기하는 저자가 사용하는 작업에서 강력한 실패를 겪습니다. 모델을 최적화하는 것입니다. 즉, 매개 변수 공간을 탐색하고 로컬 또는 희망적인 글로벌 최적을 찾는 것입니다. 이것은 일반적으로 실제 문제에 최적 이 아닙니다 . 모델의 작성자는 일반적으로 올바른 용어를 사용하고 모든 가정을 공개하지만 대부분의 사용자는 가정하지 않은 것으로 알려진 가정에 대해 광택을 내며 "학습"및 "최적화"및 " 매개 변수화 "를 참조하십시오.

이 모델의 최적의 매개 변수화는 사람들이 기계 학습, 특히 감독되는 기계 학습에서 의미하는 것이라고 생각합니다. 비록 "모델을 배우십시오"라는 말을 많이 들었지만 말할 수는 없습니다. 모델을 훈련시키고, 컴퓨터는 모델의 파라미터를 학습합니다. 감독되지 않은 학습에서도 "학습"은 대부분 모델의 매개 변수 화일 뿐이며, "모델 학습"은 모델의 최적의 매개 변수화입니다. 같은 것을 최적화하기 위해). 차라리 "모델 훈련"을 사용하겠습니다

사실, 내 연구의 대부분은 더 나은 모델을 발견하거나 더 계산적이고인지 적 / 생물학적 / 생태 학적으로 그럴듯한 모델을 발견하는 관점에서 모델을 배우는 것에 관한 것입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.