머신 러닝에서 모델의 정의


11

이것은 우리가 항상 기본 분포를 가정하지 않는 때문에 정의는 매우 적용되지 않습니다. 그렇다면 모델이란 무엇입니까? 하이퍼 파라미터가 지정된 GBM을 모델로 간주 할 수 있습니까? 모델이 규칙 모음입니까?


2
한 단계 더 발전하여 en.wikipedia.org/wiki/Mathematical_model을 살펴볼 수 있습니다. 대부분의 ML 모델은 "통계 모델"과 일치하지 않더라도 해당 정의와 일치합니다 (거의 모든 교육을받지 않은 사람은 감독 된 ML 모델은 통계 모델로 간주됩니다).
Neil Slater

답변:


7

나는 최근에 같은 질문에 관심이 있었고 기계 학습에서 "모델"에 대한 단일 정의가 없다는 것을 깨달았습니다. 특정 소프트웨어 프로그램에 대한 문서, 사용자 커뮤니티에 의해 채택 된 속어, 또는 학술지에 따라 크게 다를 수있는 출판 된 학술 논문에 사용 된 정의 일 수 있습니다. 또한 이러한 논문은 기계 학습 전문가뿐만 아니라 기계 학습 기술 (예 : 이미징, 다양한 의료 분야 등)을 적용 해야하는 다른 분야의 전문가가 작성한다는 점을 명심해야했습니다. . 그들 중 많은 사람들이 "모델"이라는 용어를 명시 적으로 정의하지 않았는데,이 용어는 종종 느슨하게 사용됩니다. 다음은 "모델"에 대한 몇 가지 정의입니다.

• 통계 모델, 특히 확률 분포와 관련된 통계.

• 회귀 데이터 및 관련 통계.

• Neil Slater가 언급 한 수학적 모델.

• 관련된 열, 데이터 유형, 데이터 소스 및 기타 메타 데이터와 같은 기계 학습에 사용되는 데이터 모델. 내가 처음 나열된 세 가지와 달리이 정의에 대해 전혀 수학적인 것이 없기 때문에 이것은 특히 까다 롭습니다. 예를 들어 SQL Server "마이닝 모델"에 대한 모든 설명서를 참조하십시오.이 설명서는 기계 학습 목적으로 이중 작업을 수행합니다.

• 때로는 위의 모든 정의가 신경망의 사양과 같은 메타 데이터와 메타 데이터 위에 구축 된 머신 러닝 구조를 포함하도록 확장되었습니다. 다른 경우에는 개별 엔티티로 간주됩니다.

소스에 따라 위의 모든 내용이 혼합되어 일치하는 경우가 있습니다. 이 목록에서 제외 된 "모델"에 대한 다른 정의가있을 것이므로 문제가 더욱 복잡해집니다. 이 모호성을 처리하기 위해 저자가 "모델"이라는 용어를 사용할 때마다 저자의 의도를 신성하게 훈련 시키려고 노력하고 있습니다. 때로는 저자가 작업하는 맥락이나 분야에 따라 결정하기가 쉽지만 다른 경우에는 기사 나 문서를 자세히 이해하기 전에 자세히 읽어야합니다. 나는 그것에 대해 더 결정적이기를 바란다. 그러나 그것은 실제로 자연스럽게 퍼지 용어이다. 이것에 대한 간단한 단일 크기에 대한 모든 대답은 없을 것입니다. 도움이 되길 바랍니다.


1
기계 학습의 맥락에서 "모델"이라는 용어는 실제로 많은 것들에 적용될 수 있지만, 모델은 학습 / 훈련을 통해 생성 된 인공물입니다.
Syzygy

5

Tom Mitchell이 제공 한 머신 러닝 정의가 마음에 듭니다 .

컴퓨터 프로그램은 배우라고 경험 E 일부 클래스에 대해 태스크 T성능 계수 P P T에 의해 측정 태스크에서 그 성능, E. 경험으로 향상되는지

따라서이 정의를 감안할 때 클래스 T를 수행 한 후 모델이 얻은 경험이라고 말해야합니다.


경험이 훈련 세트가 아닌가?
Itamar Mushkin

4

Amazon Machine Learning 에 관한 기사에서

ML 모델 학습 프로세스에는 학습 할 학습 데이터가 포함 된 ML 알고리즘 (즉, 학습 알고리즘)을 제공하는 과정이 포함됩니다. The term ML model refers to the model artifact that is created by the training process.


2

느슨하게 말하면 모델은 어떤 일이나 프로세스를 단순화합니다. 예를 들어 지구의 모양은 실제로 구체가 아니라 지구를 디자인하는 경우 구체로 취급 할 수 있습니다. 마찬가지로, 우주가 결정 론적이라고 가정하면 고객이 웹 사이트에서 제품을 구입할지 여부를 결정하는 자연스러운 프로세스가 있습니다. 우리는 그 과정과 비슷한 것을 만들어서 고객에 대한 정보를 제공하고 고객이 제품을 구매할 것이라고 생각하는지 알려줍니다.

"머신 러닝 모델"은 머신 러닝 시스템으로 구성된 모델입니다.

(이것은 엄격한 답변이 아닌 것에 대한 사과이지만 이것이 여전히 유용하기를 바랍니다.)


1

머신 러닝 패러다임에서 모델은 각각 회귀, 분류 및 강화 범주에 대한 각 예측, 클래스 및 동작에 대한 입력 자리 표시 자와 함께 모델 매개 변수의 수학적 표현을 나타냅니다.

이 표현은 단일 뉴런에 모델로 포함됩니다.

단일 층 퍼셉트론 및 딥 러닝 모델의 경우, 뉴런과 레이어를 신중하게 걸어서 순서대로 활성화 기능을 수집하고 스티치하여이 모델을 추출해야합니다.


0

기계 학습에서 모델은 무게 중심이며 모든 것은 모델을 중심으로 이루어집니다. 사람마다 모델의 정의가 다릅니다. 그러나 제 생각에, 우리는 모델을 정의하는 가장 좋은 방법은 다음과 같습니다. "머신 러닝의 모델은 데이터를 맞추고 보이지 않는 데이터를 예측하려고하는 가설"입니다.


0

기계 학습에서 모델은 입력 값의 인스턴스에 대한 예측, (재) 반응 또는 변환을 수행 할 수있는 추상화입니다. 모델은 종종 기준 모델, 다항식 또는 출력 생성 방법을 정의하는 규칙 세트 (예 : 의사 결정 트리)로 사용되는 일련의 관측치의 평균값과 같은 단일 숫자 일 수 있습니다.

일반적으로 모델은 작업을 수행하도록 최적화 할 모델의 구조와 용량을 정의하는 일련의 규칙 및 하이퍼 파라미터로 정의됩니다. 하이퍼 파라미터는 다항식의 정도 또는 결정 트리의 깊이 일 수 있습니다. 모델은 특정 목표에 대해 매개 변수가 최적화되는 최적화 프로세스를 거칠 수 있습니다.

최적화 프로세스는 종종 피팅에 대한 훈련이라고하며 피팅 된 모델의 결과이며 간단히 모델이라고도합니다. 모델이 훈련되었거나 그렇지 않은 경우 상황에서 종종 추론해야합니다.


0

이것은 재미있는 토론입니다! 내 두 센트는 모델이 가능한 입력 세트에서 적절한 출력 세트로의 매핑을 추정하기 위해 컴퓨터가 해석 할 수있는 정보를 저장한다는 것입니다. 모델은 더 복잡한 함수에 가까운 간단한 함수의 정의에 지나지 않습니다. 복잡한 함수가 실제 현상 일 필요는 없으며 모델이 복잡한 정보를 완벽하게 재현하기 위해 충분한 정보를 저장하지 않고 복잡한 함수에 근접 할 때만 필요합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.