추론 대 추정?


30

기계 학습 의 맥락에서 "추론"과 "추정"의 차이점은 무엇입니까 ?

초보자로서 우리는 임의 변수를 추론 하고 모델 매개 변수를 추정 한다고 생각합니다 . 내 이해가 맞습니까?

그렇지 않다면 차이점은 무엇이며 언제 사용해야합니까?

또한 "학습"의 동의어는 무엇입니까?


Quora 에서이 답변을 찾았 으며 정확성이 확실하지 않습니다.
Sibbs Gambling

4
머신 러닝은 단지 자동 통계 (내 의견으로는)이므로 통계에서 정의가 더 일반적으로
다를지

5
표준 통계 문헌은 추정 된 기본 모델의 특성 (의사 이론 이론적 프레임 워크)을 추정하는 것과 랜덤 변수의 값을 예측 하는 것 사이에 명확하고 일관된 차이를 만듭니다 . 추정 은 특별한 종류의 추론입니다. 이것들은 탐색과 어느 정도 가설 테스트와 대조 될 수 있습니다. 전이 동사로서 "학습"은 표준 통계적 의미가 없습니다.
whuber

@whuber, 어리석은 제안-답이 되시겠습니까? ..
StasK

2
@StasK 통계보다는 기계 학습 에 관해 묻는 질문을 다루지 않는 한 제외됩니다 . ML 답변을 이해하고 평가할 수있는 약간의 배경을 제공하려는 노력의 일환으로이 의견을 제시했습니다. 특히 이러한 답변 중 일부는 추론, 추정 및 예측간에 비표준 적으로 구분되는 것으로 보입니다.
whuber

답변:


30

통계적 추론은 주어진 데이터 세트와 해당 모델의 적합도를 포함한 관련 가설 모델에서 도출 할 수있는 전체 결론 모음으로 구성됩니다. Wikipedia 에서 인용하자면 ,

추론은 알려진 또는 사실이라고 가정 한 곳에서 논리적 결론을 도출하는 행위 또는 프로세스입니다.

과,

통계적 추론은 수학을 사용하여 불확실성이있을 때 결론을 도출합니다.

추정은 데이터를 기반으로 한 최적의 솔루션 (및 해당 매개 변수에 대한 사전 정보)으로 알 수없는 매개 변수 (데이터를 생성 한 가상 모델과 연관된)를 대체하는 추론의 한 측면 일뿐입니다. 보고 된 추정치의 불확실성 평가, 추론의 필수 부분 인 평가와 항상 관련되어야합니다.

최대 우도는 추정의 한 예이지만 전체 추론을 다루지는 않습니다. 반대로 베이지안 분석은 완벽한 추론 기계를 제공합니다.


4
기계 학습과 "데이터 과학"에서 수행되지 않는 "보고 된 추정치의 불확실성 평가와 항상 관련이 있어야합니다." 알려진 데이터 세트에 대한 벤치마킹은 아닙니다.
Momo

4

추정 자체가 미지의 파라미터 (예를 들어, 로지스틱 회귀의 계수 또는지지 벡터 머신의 분리 초평면 계수)의 값을 도출 하는 것을 목표로 하지만 , 통계적 추론 은 불확실성 및 / 또는 확률 진술을 모수 값 (표준 오차 및 신뢰 구간). 통계학자가 추정 한 모형이 대략 정확하다고 가정하면, 새로운 수신 데이터가 해당 모형을 계속 준수한다면 불확실성 진술에 진실이있을 수 있으며 얼마나 자주 실수를하는지 측정 할 수 있습니다. 결정을 내릴 모델.

확률 진술의 출처는 두 가지입니다. 때때로, 당신은 당신이 측정하는 것의 기본 확률 분포를 가정 할 수 있으며, 수학적 요술 (가우시안 분포의 다변량 통합 등)으로 결과의 확률 분포를 얻습니다 (가우시안 데이터의 샘플 평균은 가우시안입니다) ). 베이지안 통계에서 활용 된 선행은 그 주술 범주에 속합니다. 다른 경우에는, 충분히 큰 표본에서, 어떤 방식으로 행동 할 수밖에없는 점근 적 결과 (대규모 표본) 결과에 의존해야합니다 (중앙 한계 정리 : 평균이 iid 인 데이터의 표본 평균 및 분산 는 평균 및 분산을 갖는 대략 가우스입니다.μσ2μσ2/원본 데이터의 분포 형태에 관계없이 ).

머신 러닝에 가장 근접한 것은 샘플이 훈련과 검증 부분으로 나뉘어 질 때의 교차 검증이며, 후자는 효과적으로 "새 데이터가 기존 데이터처럼 보이지만 데이터와 완전히 관련이없는 경우 내 모델을 설정하는 데 사용 된 경우, 오류율의 현실적인 측정은 이와 같습니다. " 통계적 가정을하고 위의 CLT와 같은 수학적 결과를 포함하여 모델의 속성을 유추하지 않고 데이터에서 동일한 모델을 실행함으로써 완전히 경험적으로 도출됩니다. 아마도 이것은 더 정직하지만 정보를 덜 사용하기 때문에 더 큰 표본 크기가 필요합니다. 또한 프로세스가 변경되지 않는다고 암시 적으로 가정합니다.

"후부 추론"이라는 구절이 의미가있을 수 있지만 (베이지안은 아니며, 실제로 수용되는 용어가 무엇인지 알 수는 없습니다), 그 추론 적 단계에서 가정을하는 데는 많은 관련이 없다고 생각합니다. 모든 베이지안 가정은 (1) 이전 모델과 (2) 가정 된 모델이며, 일단 설정되면 후부는 자동으로 따릅니다 (적어도 베이 즈 정리를 통한 이론에서는 실제 단계는 helluvalot 복잡하고, 깁스 도박 ... 실례합니다. 깁스 샘플링은 그 후부에 도달하는 데 비교적 쉬운 요소 일 수 있습니다). "후부 추론"이 (1) + (2)를 언급한다면, 그것은 통계적 추론의 풍미입니다. (1)과 (2)가 별도로 언급 된 후 "후부 추론"이 다른 것이라면


2

모집단의 대표 표본이 있다고 가정하십시오.

이 표본을 사용하여 모형을 추정하고 결과를 특정 정확도로 전체 모집단으로 확장 할 수 있다고 진술합니다. 추론하는 것은 대표 표본 만 사용하여 모집단을 가정하는 것입니다.

추정은 데이터 샘플에 맞는 모델을 선택하고 해당 모델의 매개 변수에 대해 특정 정밀도로 계산하는 것입니다. 전체 모집단이 아닌 데이터 샘플 만 있기 때문에 모수의 실제 값을 계산할 수 없으므로 추정이라고합니다.


"모형은 모형을 추정하기 위해 표본을 사용할 때"이며 따라서 모수를 추정합니다. "추정은 모델의 매개 변수를 계산할 때입니다." 차이점이 있습니까?
nbro

2

통계에 대한 배경 지식이없는 사람에게 답변을 제공하려는 시도입니다. 더 자세한 내용에 관심이있는 사람들에게는 주제에 대한 유용한 참고 자료가 많이 있습니다 ( 예 : 이와 같은 참조 ).

짧은 답변:

>

>

긴 대답 :

"추정"이라는 용어는 종종 알 수없는 값에 대한 추정치를 찾는 프로세스를 설명하는 데 사용되는 반면, "추론"은 통계적 추론, 랜덤 변수의 분포 (또는 특성)를 발견하고이를 사용하여 결론을 도출하는 프로세스를 의미합니다.

다음 질문에 대한 답을 생각해보십시오. 우리 나라의 평균적인 사람의 키는 얼마나됩니까?

견적을 찾으려면 며칠 동안 걸어 다니면서 거리에서 만나는 낯선 사람을 측정 한 다음 (샘플 만들기) 샘플의 평균과 같은 견적을 계산할 수 있습니다. 당신은 약간의 추정을했습니다!

다른 한편으로, 당신은 당신이 하나의 숫자이고 틀린 것으로 알고있는 일부 추정치보다 더 많은 것을 찾고 싶을 수 있습니다. 당신은 다음과 같은 확실한 확신을 가지고 질문에 대답하는 것을 목표로 할 수 있습니다.

그러한 주장을하기 위해서는 당신이 만나는 사람들의 신장 분포를 추정하고이 지식을 바탕으로 결론을 내려야합니다. 이는 통계적 추론의 기초입니다.

시안의 답변에서 지적한 바와 같이 명심해야 할 중요한 점은 추정자를 찾는 것이 통계적 추론의 일부라는 것입니다.


1
"다음 무작위 사람의 키는 얼마나 될까"는 추정보다는 통계적 예측 의 문제입니다 . "모든 사람의 중간 95 %의 범위는 얼마입니까?"는 (간격) 추정치입니다. 두 가지 질문 (및 해결 방법)은 서로 밀접하게 관련되어 있고 비슷하지만, 몇 가지 중요한 방식이 다르며 다르게 대답합니다. 두 번째 질문에는없는 첫 번째 질문에서 다음 사람 의 무작위성에서 차이가 발생합니다 .
whuber

나는 그 예가 이상적이지 않다는 것에 동의한다. 질문의 본질을 감안할 때, 나는 비 통계학자가 잘 알고있는 예를 제시하려고했습니다. "추정"에 대한 가장 간단한 대답은 통계 모델의 매개 변수를 맞추는 것과 관련이 있지만 설명이 필요한 "피팅"및 "통계 모델"이라는 용어를 소개하겠습니다. 하루가 끝날 무렵 예제에 설명 된 예측은 미래 예측이지만 여전히 (포인트) 추정치입니다.
의미 수단

예측을 포함하지 않도록 예제를 변경했습니다.
의미 수단

1

오늘날 다양한 분야의 사람들이 ML 분야에서 경력을 쌓고 있으며 약간 다른 방언을 말할 가능성이 있습니다.

그러나 어떤 용어를 사용하든 뒤에있는 개념은 서로 다릅니다. 따라서 이러한 개념을 명확하게 이해하고 원하는 방언을 번역하는 것이 중요합니다.

예 :

Bishop의 PRML에서

훈련 데이터를 사용하여 의 모형을 학습하는 추론 단계(기음케이|엑스)

그래서 여기 Inference= Learning=Estimation

그러나 다른 자료에서 추론은 추정과 다를 수 있으며, 여기서 inference수단 은 매개 변수의 학습 절차 predictionestimation의미합니다.


0

머신 러닝의 맥락에서 추론은 관측치에 따라 잠재 된 (숨겨진) 변수의 설정을 발견하는 행위를 말합니다. 여기에는 잠재 변수의 사후 분포 결정도 포함됩니다. 추정은 모델 파라미터를 결정하는 "점 추정"과 관련이있는 것 같습니다. 예에는 최대 가능성 추정이 포함됩니다. 기대 최대화 (EM)에서는 E 단계에서 추론을 수행합니다. M 단계에서는 모수 추정을 수행합니다.

사람들이 "후부 분포 추정"보다 "후부 분포 추정"이라고 말하는 것을 들었습니다. 후자는 일반적인 정확한 추론에 사용되지 않습니다. 예를 들어, 예측 전파 또는 변형 베이에서 사용되며, 정확한 후방을 추론하는 것이 어렵고 후방에 대한 추가 가정이 이루어져야합니다. 이 경우 유추 된 후부는 근사치입니다. 사람들은 "후부 근사치"또는 "후부 추정치"라고 말할 수 있습니다.

이 모든 것이 내 의견 일뿐입니다. 규칙이 아닙니다.


0

"추론"부분을 확장하여 다른 사람의 답변에 추가하고 싶습니다. 머신 러닝과 관련하여 흥미로운 추론 측면은 불확실성을 추정하는 것입니다. ML 알고리즘에서는 일반적으로 까다 롭습니다. 분류 레이블에 신경망 또는 의사 결정 트리가 튀어 나오는 표준 편차를 어떻게 설정합니까? 전통적인 통계에서는 분포 가정을 통해 수학을 수행하고 모수의 불확실성을 평가하는 방법을 알아낼 수 있습니다. ML에는 모수, 분포 가정이 없거나 둘 다 없을 수 있습니다.

이러한 측면에서 일부 진전이 있었으며 일부는 매우 최근 (현재 답변보다 최신)입니다. 한 가지 옵션은 다른 사람들이 언급했듯이 후부가 불확실성 추정치를 제공하는 베이지안 분석입니다. 부트 스트랩 유형 방법이 좋습니다. Stanford의 Stefan Wager와 Susan Athey는 지난 몇 년간 임의의 숲에 대한 추론을 받고있는 일부 작업을 수행했습니다 . 분석적으로 BART 는 베이지안 트리 앙상블 방법으로 추론을 도출 할 수있는 후부를 산출합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.