예측과 추론의 차이점은 무엇입니까?


37

나는 " 통계 학습에 대한 소개 "를 읽고 있습니다. 2 장에서는 함수 추정 대한 이유를 설명 합니다.f

2.1.1 왜 추정 ?f

우리가 추정 할 수있는 두 가지 이유가 있습니다 f를 : 예측추론 . 우리는 차례로 차례로 토론합니다.

몇 번에 걸쳐 읽었지만 예측과 추론의 차이점에 대해서는 여전히 불분명합니다. 누군가가 (실제적으로) 차이점의 예를 제공 할 수 있습니까?


5
통계 학습 입문의 저자는 여기서 장애를 일으켰습니다. 원인과 결과를 이해하기 위해 추론하는 것처럼 예측을하는 것으로 추론합니다. Merriam-webster.com은 주로 "추론"을 "사실 또는 구내에서 결론으로 ​​도출하는"것으로 정의합니다. 그것은 인과 적 추론 모두를 다룹니다. 인과성 문제 만 포함하도록 "추론"의 정의를 좁히는 것은 오해의 소지가 많고 혼란스럽고 장기적인 표준 사용에 반대합니다. 따라서 예측 적 추론과 인과 추론을 대조해 봅시다.
rolando2

2
@ rolando2 : 그런 다음 설명 적 추론 , 즉 설명 적이 지 않은 (인과 적이 지 않은) 모델의 매개 변수에 대한 추론이 필요하다고 생각 합니다.
kjetil b halvorsen

답변:


29

추론 : 데이터 집합이 주어지면 출력이 데이터의 함수로 생성되는 방식을 추론하려고합니다.

예측 : 새로운 측정 값이 주어지면 기존 데이터 세트를 사용하여 일련의 결과에서 올바른 식별자를 안정적으로 선택하는 모델을 작성하려고합니다.


추론 : 연령, 승객 등급 및 성별이 타이타닉 재난 생존에 어떤 영향을 미치는지 알아보고 싶습니다. 로지스틱 회귀 분석을 적용하고 각 승객 특성이 생존율에 미치는 영향을 추론 할 수 있습니다.

예측 : 타이타닉 승객에 대한 정보가 제공되면 세트를 선택 하고 가능한 한 정확해야합니다. (가능한 한 자주 올바른 방법을 궁금해하는 경우 예측에 대한 편향 편차 트레이드 오프를 참조하십시오.){lives,dies}


예측은 입력과 출력 사이의 가장 정확한 관계를 설정하는 데 중점을 두지 않으며 정확한 예측은 새로운 관측치를 가능한 한 자주 올바른 클래스에 배치하는 데주의를 기울입니다.

따라서 '실제적인 예'는 다음과 같은 차이로 요약됩니다. 단일 승객에 대한 승객 데이터 세트를 고려할 때 추론 방법을 통해 생존 가능성을 알 수 있으며 분류기는 생명 또는 사망 중에서 선택할 수 있습니다.

분류 기준 조정은 p- 값과 신뢰 구간을 올바르게 해석하는 것과 같은 방식으로 매우 흥미롭고 중요한 주제입니다.


1
좋은 대답입니다. 그러나 어떤 사람들은 "추론"이라는 단어를들을 때 "인과 적 추론"이라고 생각합니다. ISLR이 그것에 초점을 맞추지 않았음에도 불구하고 그것에 대해 무언가를 말하고 싶을 수도 있습니다.
generic_user 2016

1
딥 러닝 세계에서 추론은 예를 들어 예측과 거의 동일하다고 생각합니다. blogs.nvidia.com/blog/2016/08/22/…
user1893354

1
이것은 나에게 완벽하게 좋은 답변 인 것 같습니다.
gung-Monica Monica 복원

3
나는이 대답이 잘못되었다고 생각한다. 특히 "추론 접근법은 당신에게 생존 가능성을 제공하고, 분류기는 당신에게 삶과 죽음 사이에서 선택을 제공한다", 더 구체적으로 첫 부분이다. 승객이 생존 할 확률을 계산하는 것은 예측, 특히 확률 적 예측입니다. 연속적인 경우 밀도 예측이됩니다. 그런 다음 예측 된 확률을 임계 값으로 설정하여 어려운 분류를 얻을 수 있습니다. ...
S. Kolassa-

3
... 예측은 결과 를 예측하는 것에 관한 것이며 , 추론은 입력 과 결과 의 관계를 이해하는 것에 관한 것입니다 : 어떤 입력이 그러한 관계를 가지고 있는지, 그리고 어떻게 "참"관계를 랜덤 공변량과 구별 할 수 있습니까 올)? 내가 실수 한 곳을 누군가가 설명 할 수 있습니까?
S. Kolassa-

11

일반적으로 데이터 분석을 수행 할 때 데이터를 발생시키는 일종의 "데이터 생성 프로세스"가 있다고 가정하고 추론은이 프로세스의 구조에 대한 학습을 ​​의미하는 반면 예측은 데이터에서 나오는 데이터를 실제로 예측할 수 있음을 의미합니다. . 종종 두 사람이 함께되지만 항상 그런 것은 아닙니다.

두 사람이 함께 사용하는 예는 간단한 선형 회귀 모델입니다.

Yi=β0+β1xi+ϵi.

이 경우 추론은 및 모델의 매개 변수를 추정하는 것을 의미 하며 예측은 이러한 매개 변수의 추정치에서 계산됩니다. 그러나 현명한 예측을 할 수있는 다른 유형의 모델이 있지만, 모델이 반드시 배후에서 일어나는 일에 대한 의미있는 통찰력으로 이어지지는 않습니다. 이러한 종류의 모델의 일부 예는 복잡한 앙상블 방법으로 예측이 좋을 수 있지만 때로는 이해하기 어렵거나 불가능합니다.β 1β0β1


3
"하지만이 모델이 장면 뒤에서 일어나는 일에 대한 의미있는 통찰력으로 이어질 필요는 없습니다." " 블랙 박스 " 라는 용어 가 떠 오릅니다. :)
Alexis

또는 다층 신경망
Shihab Shahriar 칸

"하지만 합리적인 예측을 할 수있는 다른 유형의 모델이 있지만이 모델이 장면 뒤에서 무슨 일이 일어나고 있는지에 대한 의미있는 통찰력을 제공하지는 않습니다." 정의한 추론 문제는 여전히 모델의 매개 변수를 결정하는 문제입니다. 나는 당신이 왜 "그러나"로이 문장을 시작하는지 그리고 왜 당신의 추론과 예측의 정의와 관련하여이 문장을 썼는지 이해하지 못합니다.
nbro

1
"그러나"의 사용은 앞의 모델과 다음 모델의 설명이 모두 정확하기 때문입니다. 그러나 다음 모델은 예측추론 의 차이점을 파악할 때까지 예상하지 못한 방식으로 이전 모델의 특성과 다릅니다. 그것은 설명되고 있습니다. 나는 이미 구별에 익숙하지만,이 예는 통찰력 있고 도움이됩니다. +1
gung-Monica Monica 복원

10

이 책의 20면에서 저자들은 그 차이를 이해하게 해주는 아름다운 예를 제시합니다.

다음은이 책의 단락입니다. 통계 학습 소개

예를 들어 , 부동산 환경에서 범죄율, 구역 설정, 강과의 거리, 대기 질, 학교, 지역 사회 소득 수준, 주택 크기 등과 같은 투입물과 주택 가치를 연관시킬 수 있습니다. 이 경우 개별 입력 변수가 가격에 어떻게 영향을 미치는지에 관심이있을 수 있습니다. 즉 , 강을 볼 수 있다면 집이 얼마나 가치가 있을까요? 이것은 추론 문제 입니다. 특성 주어진 가정의 가치를 예측 : ? 이상 값 과소이 집 이것은이다 예측 문제 ".


5

예측 은 추정 f 를 사용 하여 미래를 예측합니다. 변수 를 관찰한다고 가정하면 상점의 수익 일 수 있습니다. 비즈니스를위한 재정 계획을 세우고 다음 분기에 수익을 예측해야합니다. 수입은 이번 분기 의 인구 소득 과 연도의 시간에 달려 있다고 생각합니다 . 따라서 함수임을 x 1 , t x 2 , t y t = f ( x 1 , t - 1 , x 2 , t - 1 ) + ε tytx1,tx2,t

yt=f(x1,t1,x2,t1)+εt

이제 소득에 관한 데이터를 얻고 BEA의 개인 일회용 소득 시리즈라고 말하고 시간 변수를 구성하면 함수 f를 추정 한 다음 인구 소득의 최신 값과 연중 시간을 여기에 꽂을 수 있습니다 기능. 그러면 상점 매출의 다음 분기에 대한 예측이 생성됩니다.

추론 은 추정 함수 f 를 사용 하여 요인이 결과에 미치는 영향을 연구하고이 특성의 다른 일을 수행합니다. 앞의 예에서 당신은 계절의 계절이 상점의 수입을 결정하는 데 관심이있을 것입니다. 따라서 계절 미분 인 부분 미분 있습니다. 경우 f는 사실 선형 모델을 한 후, 그 제 2 가변의 회귀 계수 것 . β 2 x 2 , t 1f/x2tβ2x2,t1

예측과 추론은 f 를 결정하기 위해 동일한 추정 절차를 사용할 수 있지만이 절차와 수신 데이터에 대한 요구 사항이 다릅니다. 잘 알려진 경우를 소위 공선 성 (collinearity ) 이라고하며 , 입력 변수는 서로 밀접하게 관련되어 있습니다. 예를 들어, 비만인의 체중, 신장 및 배 둘레를 측정합니다. 이러한 변수는 반드시 선형 일 필요는 없지만 강한 상관 관계가있을 수 있습니다. 있도록 발생 공선가 에 대한 심각한 문제가 될 수 추론 만에 단지 짜증 예측 . 그 이유는 예측 변수x상관 관계가 있으므로 예측 변수와 다른 예측 변수의 영향을 구분하기가 더 어렵습니다. 예측에는 문제가되지 않지만 예측 품질 만 신경 써야합니다.


3

집중 치료실의 의사라고 가정 해보십시오. 열이 강한 환자와 지정된 수의 혈액 세포, 주어진 체중과 100 가지의 다른 데이터가 있고 생존 할 것인지 예측하려고합니다. 그렇다면, 그는 다른 아이에 대한 이야기를 아내에게 숨기려고 할 것입니다.

의사는 자신의 병력에 있던 이전 환자의 데이터를 기반으로이 예측을 수행 할 수 있습니다. 소프트웨어 지식을 바탕으로 일반 선형 회귀 (glm) 또는 신경망 (nn)을 사용하여 예측할 수 있습니다.

1. 일반화 선형 모형

결과에 도달하기 위해서는 glm에 대해 많은 상관 된 매개 변수가 존재하므로 의사는 가정 (선형성 등)과 영향을 미칠 수있는 매개 변수에 대한 결정을 내려야합니다. glm은 각 매개 변수에 대해 t- 검정으로 그에 대한 보상을 해주므로 성별과 열이 반드시 체중에 큰 영향을 미치지 않는다는 강력한 증거를 얻을 수 있습니다.

2. 신경망

신경망은 이전 환자의 샘플에있는 모든 정보를 삼키고 소화합니다. 그것은 예측 변수가 상관되어 있는지 여부에 상관하지 않으며 체중의 영향이 현재 샘플에서만 또는 일반적으로 (적어도 의사의 전문 지식 수준에서는 아님) 중요한지 여부에 대한 많은 정보를 공개하지 않습니다. 제공해야합니다). 결과 만 계산합니다.

더 나은

선택할 방법은 문제를 보는 각도에 따라 다릅니다. 환자로서, 나는 선형성과 같은 강력하고 명백히 잘못된 가정없이 일어날 수있는 일에 대한 최선의 추측을 위해 모든 가능한 데이터를 사용하는 신경망을 선호합니다. 저널에 일부 데이터를 제시하려는 의사는 p- 값이 필요합니다. 의학은 매우 보수적입니다. 그들은 p- 값을 요구할 것입니다. 따라서 의사는 그러한 상황에서 성별이 중요한 영향을 미친다고보고하려고합니다. 환자에게는 문제가되지 않습니다. 시료에 가장 큰 영향을 미치는 것으로 사용하십시오.

이 예에서, 환자는 예측을 원하고, 의사의 과학자 측은 추론을 원합니다. 대부분 시스템을 이해하려면 추론이 좋습니다. 시스템을 이해할 수없는 곳에서 결정을해야하는 경우 예측이 충분해야합니다.


1
"환자로서 신경망을 선호 할 것입니다 ..." 임상 과학에서 많은 양의 데이터를 얻기가 매우 어렵다는 사실을 무시하는 것 같습니다. 보안, 개인 정보 보호 및 윤리적 문제로 인해 그룹당 여러 관측치의 데이터 세트는 드문 일이 아닙니다. 데이터 생성 프로세스에 대해 방어 가능한 가정을 할 수 있으면 데이터를 훨씬 더 효율적으로 사용할 수 있습니다.
Frans Rodenburg

이것은 겉보기에 같은 문제가 왜 추론 질문과 예측 문제를 유발할 수 있고 왜 같은지에 대해 쉽게 연관 될 수있는 가상의 시나리오로 여겨졌습니다. 나는 실제로 환자의 생존 가능성을 예측하는 방법을 제안하지 않았으며, 네, 눈에 띄는 크기의 신뢰할 수있는 임상 데이터를 얻는 것이 얼마나 어려운지 잘 알고 있습니다. 데이터 생성 과정에 대한 IMHO의 좋은 가정 / 지식은 예측과 추론에 도움이 될 것이므로 두 가지를 구별하는 데별로 도움이되지 않습니다.
Bernhard

1

당신은 혼자가 아닙니다. 답을 읽은 후에는 더 이상 혼란스러워하지 않습니다. 차이를 이해하기 때문이 아니라 그것이 보는 사람의 눈에 있으며 구두로 유도된다는 것을 이해하기 때문입니다. 저는 이제이 두 용어가 과학적인 용어가 아니라 정치적 정의라고 확신합니다. 대학이 좋은 책으로 사용하려고 한 책의 설명을 예로 들어 보자. 내 관점에서 볼 때 이것은 절대적으로 예측 문제입니다. 귀하는 토목 공사 회사의 소유주이며 다음 주택을 짓기위한 최고의 장소를 선택하려고합니다. 같은 도시에서 강 근처, 기차역 근처의 두 위치 중에서 선택해야합니다. 당신은 예측 하고 싶어두 위치의 가격. 아니면 추론 하고 싶습니다 . 정확한 통계 방법을 적용하지만 프로세스 이름을 지정합니다. :)


강의 전망이 특정 가격을 필요로한다는 생각은 인과적인 해석입니다. 예측은 인과 관계에 대해 불가지론 적이다 : 나는 원인, 영향으로 인한 영향, 또는 유사한 원인으로 다른 영향으로부터 1 개의 영향을 예측할 수있다. 5'10 "인 친구 Billy와 내가 만난 적이없는 같은 쌍둥이 Bobby를 가지고 있다고 생각해보십시오. 그럼에도 불구하고 Bobby가 5'10"이라고 예측할 수 있습니다. 빌리가 더 키가 클 것으로 예상 할 수는 없습니다.
gung-Monica Monica 복원

당신이 인용 한 예는 단순히 좋지 않은 예입니다. 그것이 혼동되는 이유입니다. "정치"보다 추론과 선행의 차이가 분명히 더 많습니다.
Richard Hardy

1

차용자가 대출을 상환 할 것인지에 대한 강력한 예측 변수는 가구 다리로 인해 바닥이 긁히지 않도록 펠트를 사용하는지 여부를 보여주는 좋은 연구 결과가 있습니다. 이 "펠트 (felt)"변수는 결과가 상환 대 채무 불이행 인 예측 모델에 뚜렷한 도움이됩니다. 그러나, 대출 기관이이 결과에 대해 더 큰 영향력을 얻고 자한다면, 펠트를 가능한 한 넓게 배포함으로써 그렇게 할 수 있다고 생각하는 데 실패 할 것입니다.

"이 대출자가 상환 할 가능성은 얼마나됩니까?" 예측 문제입니다. "결과에 어떻게 영향을 줄 수 있습니까?" 인과 추론 문제입니다.


-1

y = f (x) 다음

예측 (주어진 x 값을 가진 Y의 값은 무엇입니까? : x의 특정 값이 Y의 값일 수 있다면

추론 (x의 변화에 ​​따라 y가 어떻게 변하는가) : x가 변하면 Y에 어떤 영향을 미칠 수 있는가

예측 예 : y가 사람의 급여를 나타내고, 수년간의 경험, 입력 변수와 같은 정도를 입력 변수로 제공하면 함수가 직원의 급여를 예측한다고 가정합니다.

추론의 예 : 생활비의 변화와 급여의 변화가 얼마라고 가정


이 답변이 왜 두 개의 공감대를 갖는지 모르겠습니다.
gung-Monica Monica 복원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.