추정과 예측의 차이점은 무엇입니까?


46

예를 들어, 나는 과거의 손실 데이터를 가지고 있으며 극단적 인 수량을 계산하고 있습니다 (위험 가치 또는 가능한 최대 손실). 결과는 손실을 추정하거나 예측하기위한 것입니까? 어디에서 선을 그릴 수 있습니까? 혼란 스러워요.


4
stats.stackexchange.com/questions/16493의 신뢰 구간과 예측 구간의 차이에 대한 논의는 밀접하게 관련되어 있습니다 .
whuber

답변:


64

실제로 "예측"과 "추정"은 비 기술적 글쓰기에서 상호 교환 적으로 사용되며 비슷한 기능을하는 것처럼 보이지만 통계적 문제의 표준 모델에서 이들 사이에는 뚜렷한 차이가 있습니다. 추정기 동안 사용 데이터는 파라미터 추측하는 예측은 데이터 세트의 일부가 아닌 어떤 임의의 값에 맞춰 데이터를 사용한다. 통계에서 "매개 변수"와 "무작위 값"의 의미에 익숙하지 않은 사람들을 위해 다음은 자세한 설명을 제공합니다.

이 표준 모형에서, 데이터는 "자연의 상태"라는 가능한 분포의 범위 내에있는 것으로 알려진 랜덤 변수 의 (다변량) 관측 값 를 구성한다고 가정합니다 . 추정기 수학 절차 그 각각의 가능한 값에 할당 일부 속성 자연 상태의 등의 수단으로, . 따라서 추정은 자연의 진정한 상태에 대한 추측입니다. 와 를 비교하여 추정치가 얼마나 좋은지 알 수 있습니다 . XxX x t ( x ) θ μ ( θ )txt(x)θμ(θ)μ ( θ )t(x)μ(θ)

예측기 다른 랜덤 변수의 독립적 인 관찰에 관한 분포 특성의 실제 상태와 관련된다. 예측은 다른 임의의 값에 대한 추측입니다. 를 실현 된 값 과 비교하여 특정 예측이 얼마나 좋은지 알 수 있습니다 . 우리는 평균적 으로 합의가 이루어질 수 있기를 바랍니다 (모든 가능한 결과 대한 평균 동시에 가능한 모든 값에 대한 평균 의미 ).Z의 P ( X ) Z의 X에 Zp(x)Zp(x)Zx Z

보통 최소 제곱은 표준 예를 제공합니다. 데이터 는 종속 변수의 값 를 독립 변수의 값 에 연결 하는 쌍 으로 구성됩니다 . 자연의 상태는 세 개의 매개 변수 , 및 . 각 는 평균 및 표준 편차 가있는 정규 분포와 독립적으로 무승부 라고합니다 . , 및 는 고정되고 변하지 않는 것으로 여겨지는 매개 변수 (숫자)입니다. 관심사는y i x i α β σ y i α + β x i(xi,yi)yixiαβσyiα+βxiα β σ α β ( α , β ) α α β β α βσαβσα (절편) 및 (경사). OLS는 서면 평가 있다는 점에서 좋은 것입니다 에 가까운 경향이 와 경향이있다 가까운 , 사정의 진실 (그러나 알 수없는) 값을 어떤 수 있습니다 .β(α^,β^)α^αβ^βαβ

OLS 예측 은 독립 변수의 일부 값 와 연관된 종속 변수 의 새로운 값 를 관찰하는 것으로 구성됩니다 . 는 데이터 세트 에서 에 있을 수도 있고 아닐 수도 있습니다 . 그것은 중요하지 않습니다. 직관적으로 좋은 예측 중 하나는이 새로운 값이 가깝다는 것 입니다. 더 나은 예측 은 새로운 값이 얼마나 가까운 지 말해 줍니다 ( 예측 간격 이라고 함 ). 이들은 및 가 불확실 하다는 사실을 설명합니다 (수학적으로 임의의 값에 의존하기 때문에xZ=Y(x)xX I α + β X α β ( Y I ) σ Y ( X ) σ α + β Xxxiα^+β^xα^β^(yi) ), 는 확실하지 않으며 (따라서 추정되어야 함), 는 표준 편차 와 정규 ( 모자가 없는지 확인하십시오!).σY(x)σα+βx

특히이 예측에는 두 가지 불확실성의 원인이 있습니다. 데이터의 불확실성 은 추정 기울기, 절편 및 잔차 표준 편차 ( )의 불확실성을 초래합니다 . 또한, 어떤 값 이 발생 할지 불확실성 이 있습니다. 가 임의 이기 때문에 이러한 추가 불확실성 은 예측을 특징 짓습니다. 예측이있다 (결국, 추정 같이 추정치 :-) 심지어 매우 같은 수학 식 (가질 수 는 때때로 와 동일 할 수 있습니다σ Y ( X ) Y ( X ) α + β X α + β (X) P ( X ) t ( X )(xi,yi)σY(x)Y(x)α^+β^x α+βxp(x)t(x))이지만 예상보다 불확실성이 더 커집니다.

여기서, 그리고, OLS의 예에서는 명확하게 구별 참조 :는 추정 (고정되지만 알 수있다)을 매개로 추측하면서 예측 임의의 양의 값의 추측. 잠재적 혼동의 원인은 예측이 일반적으로 추정 된 모수를 기반으로하며 추정기와 동일한 공식을 가질 수도 있다는 것입니다.

실제로 두 가지 방법으로 추정값과 예측 변수를 구별 할 수 있습니다.

  1. 목적 : 추정자는 실제 자연 상태의 속성을 알고 자하는 반면, 예측은 랜덤 변수의 결과를 추측하려고합니다. 과

  2. 불확실성 : 예측 변수는 랜덤 변수의 결과에 불확실성이 추가되어 일반적으로 관련 추정량보다 큰 불확실성이 있습니다. 따라서 잘 기록되고 설명 된 예측 변수에는 일반적으로 신뢰 구간이라고 알려진 추정기의 불확실성 대역보다 넓은 불확실성 대역 (예측 간격)이 있습니다. 예측 구간의 특징은 데이터 세트가 커짐에 따라 (가설 적으로) 축소 될 수 있지만 0 구간으로 축소되지는 않습니다 (임의 결과의 불확실성은 "돌이킬 수 없음"). 신뢰 구간의 폭은 충분한 양의 데이터로 추정의 정확도가 임의로 향상 될 수 있다는 직감에 따라 0으로 줄어 듭니다.

이를 잠재적 인 투자 손실 평가에 적용 할 때는 먼저 목적을 고려하십시오. 주어진 기간 동안 투자 (또는 특정 투자 바스켓)에서 실제로 얼마나 손실을 입을 수 있는지 알고 싶 습니까? 예상되는 손실 (아마도 많은 투자 분야에서)? 전자는 예측이고 후자는 추정입니다. 그런 다음 불확실성을 고려하십시오. 데이터를 수집하고 분석하는 데 거의 무한한 자원이 있다면 어떻게 대답이 바뀌겠습니까? 그것이 매우 정확 해지면 투자에 대한 예상 수익률을 추정 할 수있을 것입니다.

따라서, 어떤 동물을 다루고 있는지 확실하지 않은 경우, 견적 담당자 / 예측 자에게 물어보십시오. 그것이 얼마나 잘못되어 있고 왜 그런가? 기준 (1)과 (2)를 모두 사용하면 자신이 가진 것을 알 수 있습니다.


매우 흥미로운 답변! 그것에 대한 참고 자료를 제공해 주시겠습니까?
user1420303

2
@ user1420303 다음은 두 가지입니다. (1) 키퍼, 통계적 추론 소개 (1987), p. (30) ( "A의 예측 문제 판정이 추측되는 하나 하지 있는 특성의 보다는 확률 변수의 일부 속성 ....") (2) 한은 및 순한, 통계 간격 (1991) . 예제와 해석에 대해서는 2.3 절을 참조하십시오. F
whuber

+1. 혼합 모델에서 BLUE와 BLUP의 용어 차이를 이해하려고 노력하고 있기 때문에 귀하의 답변을 찾았습니다. 혼합 모델의 경우, 랜덤 인터셉트 , 우리가 추정 및 . 그러면 를 예측할 수 있습니다 . 이 차이는 이해합니다. 그러나 어떻습니까? 그것들은 BLU P , 즉 "예측 자" 로 계산된다 ; 그러나 하면 불확실성이 사라지는 것처럼 므로 가 추정 된다고 말해서는 안됩니다.u i ~ N ( 0 , σ 2 u ) α , β , σ , σ u y u i n u iy=α+βx+ui+ϵuiN(0,σu2) α,β,σ,σu yuinui?
amoeba는 Reinstate Monica가

2
@amoeba이 상황을 계층 적 모델로 이해하는 것이 도움이 될 수 있습니다. 계층의 한 수준에서 는 임의적이므로 (따라서 예측 것입니다. ) 나중 수준에서는 실현되었으며 후속 평가는 실현에 따라 달라집니다 ( 추정자 에 대한 진술 ). ui
whuber

2
@whuber 당신이 지적한 가장 중요한 점은 추정자가 항상 SLR 모델의 매개 변수와 같은 확률이 아닌 / 비 랜덤적인 성질로 수량을 근사하는 것입니다. 예측 변수는 항상 SLR 모델에서 응답 변수 (오류 항 포함)와 같은 확률 적 / 임의적 특성을 가진 수량을 근사화하는 데 목적이 있습니다. 이 점은 Rao의 초기 작업에서 강조됩니다.
Henry.L

8

추정은 항상 알려지지 않은 모수에 대한 것이며 예측은 랜덤 변수에 대한 것입니다.


5
임의 변수의 모수 (예 : 예상 값) 를 추정하는 동안 임의 변수 의 실현 을 예측합니다 .
Richard Hardy

@CowboyTrader, 나는 당신의 주장에 대해 언급 할 커널 밀도 추정에 대해 충분히 모른다.
Richard Hardy

2

모델에는 차이가 없습니다. 실제로 수행 된 작업에는 약간의 차이가 있습니다. 추정은 데이터를 사용하여 확률 모델의 교정입니다 (AI 용어의 "학습"). 예측은 미래 관측의 "추측"입니다. 이 "추측"이 과거의 데이터에 근거한다고 가정하면 추정의 경우 일 수 있습니다. 예를 들어 , 인구의 평균 키 추정치 를 사용하여 만날 다음 사람의 키 예측 과 같은 그러나 예측이 항상 예측의 예는 아닙니다. 다음에 만나려는 사람의 성별은 고전적인 의미에서 인구의 매개 변수가 아닙니다. 성별을 예측하려면 약간의 추정이 필요할 수 있지만 좀 더 필요할 것입니다 ...

값-위험에 처한 경우, 당신 이후 예측 및 추정이 일치 예상 손실의 인 추정 손실의 기대.


2
추정과 예측을 올바르게 구분하여 시작하지만 응답의 마지막 3 분의 2는 예측과 예측을 다시 한 번 혼동하는 것처럼 보입니다. 성별의 예를 소개하는 것은 초기 구별과 관련이 없기 때문에 여전히 혼란스러워집니다 (실제로 그것은 추정과 예측 단계 사이의 통계 모델의 전환이기 때문에 무의미합니다).
whuber

0

예측은 표본 회귀 함수를 사용하여 독립 변수의 관찰되지 않은 일부 값에 따라 종속 변수의 값을 추정하는 것입니다.

추정은 모집단의 알 수없는 모수 또는 수량을 계산하는 프로세스 또는 기술입니다.


3
간결함은 칭찬 할 만하지 만 여기서 혼동 될 수 있습니다. 예측은 회귀 응용 프로그램에만 국한되지 않으며 추정만큼이나 일반적입니다. 그럼에도 불구하고, "독립 변수의 관찰되지 않은 일부 값에 조건이 설정되었다"는 것은 정확히 무엇을 의미합니까? 그것은 예측에 데이터가 필요하다는 것을 말하는 방법입니까? 그렇다면 그러한 요구 사항을 제공하지 않는 추정은 어떻습니까? 설명은 "SD가 이고 상한 사 분위수가 인 정규 분포의 평균은 얼마입니까?" 와 같은 교과서 연습처럼 들립니다. 추정에 데이터가 필요한가? 212
whuber

0

일반적으로 "추정"은 매개 변수 용으로 예약되고 "예측"은 값용입니다. 그러나 때때로 구별이 흐려지는 경우가 있습니다. 예를 들어 "내일 가치 예측"대신 "내일 가치 추정"과 같은 것을 보았을 수 있습니다.

위험 가치 (VaR)는 흥미로운 사례입니다. VaR은 매개 변수가 아니지만 "VaR 예측"이라고 말하지 않습니다. 우리는 "Vars 추정"이라고 말합니다. 왜?

당신이 분포를 알고, 당신이 경우 그 VaR의의 이유는 임의의 양 아닙니다 필요로 계산 VaR의의 분포를 알 수 있습니다. 따라서 파라 메트릭 VaR 접근법을 사용하는 경우 먼저 분포의 모수를 추정 한 다음 VaR을 계산합니다. 비모수 VaR을 사용하는 경우 매개 변수 추정 방법과 유사한 VaR 을 직접 추정 합니다. 이와 관련하여 Quantile과 유사합니다.

한편, 손실량은 임의의 값이다. 당신이 예측 손실을 요구하는 경우 따라서, 당신은 할 거라고 예측 추정을하지. 다시, 때때로 우리는 "추정"손실을 말합니다. 그래서 앞에서 쓴 것처럼 선이 흐려집니다.


VaR은 매개 변수가 아니라고 말하지만 실제로 그런 경우인지 궁금합니다. VaR은 종속 변수 분포의 (조건부 또는 무조건) Quantile입니다. 따라서 그것은 나에게 분포의 매개 변수 또는 적어도 다른 근본적인 매개 변수의 기능처럼 보이지만 본질을 변경하지 않는 것 같습니다. 랜덤 변수의 실현처럼 보이지 않습니다.
Richard Hardy

또한 예측이 값에 대한 것이라고 말할 때 임의의 변수 (값이기도 함)의 실현과 마찬가지로 매개 변수의 값에도 적용됩니다. 따라서 값을 임의 변수의 실현으로 대체하는 것이 좋습니다. 당신은 당신이 목표로 이분법을해야합니다.
리처드 하디

-3

아래 정의가 더 설명되어 있습니다.

추정은 결과의 계산 된 근사치입니다. 이 결과는 예측 일 수 있지만 반드시 그런 것은 아닙니다. 예를 들어, 어제 오후 5시 골든 게이트 브릿지의 차량 수가 마린을 향한 3 개의 차선이 수용 가능하고 각 차량이 30 피트의 공간을 차지하고 다리의 길이가 9000 피트 ( 9000/30 x 3 = 900).

추정은 추정값이 알려진 패턴의 패턴을 따르는 것으로 가정하여 알려진 값 범위 밖의 변수 값을 추정합니다. 가장 단순하고 가장 보편적 인 형태의 외삽 법은 알려진 데이터를 기반으로 선형 추세를 추정하는 것입니다. 선형 외삽의 대안은 다항식과 원뿔 외삽을 포함합니다. 추정과 마찬가지로 외삽을 예측에 사용할 수 있지만 예측에만 국한되지는 않습니다.

예측은 단순히 미래에 대해 말하는 것입니다. 예측은 일반적으로 결과에 중점을 두지 않고 결과에 중점을 둡니다. 예를 들어, 2050 년까지 모든 차량에 2011 년 낮은 채택에서 2050 년까지 완전히 채택하는 방법을 설명하지 않고 전기 모터로 구동 될 것이라고 예측할 수 있습니다. 이전 예에서 볼 수 있듯이 예측이 데이터를 기반으로하는 것은 아닙니다.

예측은 예측 또는 예측 프로세스입니다. 예측과 예측이라는 용어는 종종 상호 교환 적으로 사용되지만 예측은 종종 결과에 대한 경로에 대한 설명을 제공한다는 점에서 예측과 구별됩니다. 예를 들어, 전기 자동차 채택 예측에는 2025 년 이전에 전기 자동차가 거의없고 2030 년에 급격한 채택으로 변곡점이 발생하며 대부분의 자동차가 전기 자동차 인 S 자형 채택 패턴에 따른 완전 전기 자동차 채택 경로가 포함될 수 있습니다. 2040.

추정, 외삽, 예측 및 예측은 상호 철저하고 포괄적 인 용어가 아닙니다. 복잡한 문제에 대한 좋은 장기 예측은 종종 그럴듯한 결과를 얻기 위해 외삽 법 이외의 기술을 사용해야합니다. 예측 및 예측은 어떤 종류의 계산 된 추정 없이도 발생할 수 있습니다.

링크 정의 참조 1 정의 2


2
예측이 반드시 미래에 관한 것은 아닙니다.
miura

완전하게 읽으십시오 : 예측은 단순히 미래에 대해 말하고 있습니다. 예측은 일반적으로 결과에 대한 경로가 아니라 결과에 중점을 둡니다.
sso

예, 그러나 결과가 미래에있을 필요는 없습니다. 예를 들어 과거의 알려지지 않은 결과를 예측할 수도 있습니다.
miura

1
이것은 "추정"과 "예측"이라는 단어가 비 기술적, 비 통계적 의미 로 어떻게 사용되는지에 대한 합리적인 설명입니다 . @miura가 제안한 것처럼, 다른 구어체로부터 구어체 감각이 기존의 통계적 감각과 다르다는 것이 명백합니다. 나는 원래의 질문을 비 통계적인 방식으로 해석하는 데 유리한 주장을 봅니다. 그러나 이러한 해석은 "예측"이 결과가 알려지지 않은
whuber

과거의 최소 편차 칼만 필터에 적용하면 노이즈가 많은 측정에서 관심있는 데이터를 복구하는 데 최소 편차 스무더를 사용할 수 있습니다. 앞서 언급 한 기술은 한 걸음 앞서는 예측 변수에 의존합니다. 따라서 여전히 한 걸음 앞서 예측 (미래) :)
sso
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.