답변:
실제로 "예측"과 "추정"은 비 기술적 글쓰기에서 상호 교환 적으로 사용되며 비슷한 기능을하는 것처럼 보이지만 통계적 문제의 표준 모델에서 이들 사이에는 뚜렷한 차이가 있습니다. 추정기 동안 사용 데이터는 파라미터 추측하는 예측은 데이터 세트의 일부가 아닌 어떤 임의의 값에 맞춰 데이터를 사용한다. 통계에서 "매개 변수"와 "무작위 값"의 의미에 익숙하지 않은 사람들을 위해 다음은 자세한 설명을 제공합니다.
이 표준 모형에서, 데이터는 "자연의 상태"라는 가능한 분포의 범위 내에있는 것으로 알려진 랜덤 변수 의 (다변량) 관측 값 를 구성한다고 가정합니다 . 추정기 수학 절차 그 각각의 가능한 값에 할당 일부 속성 자연 상태의 등의 수단으로, . 따라서 추정은 자연의 진정한 상태에 대한 추측입니다. 와 를 비교하여 추정치가 얼마나 좋은지 알 수 있습니다 . X x t ( x ) θ μ ( θ )μ ( θ )
예측기 다른 랜덤 변수의 독립적 인 관찰에 관한 분포 특성의 실제 상태와 관련된다. 예측은 다른 임의의 값에 대한 추측입니다. 를 실현 된 값 과 비교하여 특정 예측이 얼마나 좋은지 알 수 있습니다 . 우리는 평균적 으로 합의가 이루어질 수 있기를 바랍니다 (모든 가능한 결과 대한 평균 과 동시에 가능한 모든 값에 대한 평균 의미 ).Z의 P ( X ) Z의 X에 Z
보통 최소 제곱은 표준 예를 제공합니다. 데이터 는 종속 변수의 값 를 독립 변수의 값 에 연결 하는 쌍 으로 구성됩니다 . 자연의 상태는 세 개의 매개 변수 , 및 . 각 는 평균 및 표준 편차 가있는 정규 분포와 독립적으로 무승부 라고합니다 . , 및 는 고정되고 변하지 않는 것으로 여겨지는 매개 변수 (숫자)입니다. 관심사는y i x i α β σ y i α + β x iα β σ α β ( α , β ) α α β β α β (절편) 및 (경사). OLS는 서면 평가 있다는 점에서 좋은 것입니다 에 가까운 경향이 와 경향이있다 가까운 , 사정의 진실 (그러나 알 수없는) 값을 어떤 와 수 있습니다 .
OLS 예측 은 독립 변수의 일부 값 와 연관된 종속 변수 의 새로운 값 를 관찰하는 것으로 구성됩니다 . 는 데이터 세트 에서 에 있을 수도 있고 아닐 수도 있습니다 . 그것은 중요하지 않습니다. 직관적으로 좋은 예측 중 하나는이 새로운 값이 가깝다는 것 입니다. 더 나은 예측 은 새로운 값이 얼마나 가까운 지 말해 줍니다 ( 예측 간격 이라고 함 ). 이들은 및 가 불확실 하다는 사실을 설명합니다 (수학적으로 임의의 값에 의존하기 때문에xX I α + β X α β ( Y I ) σ Y ( X ) σ α + β X ), 는 확실하지 않으며 (따라서 추정되어야 함), 는 표준 편차 와 정규 ( 모자가 없는지 확인하십시오!).
특히이 예측에는 두 가지 불확실성의 원인이 있습니다. 데이터의 불확실성 은 추정 기울기, 절편 및 잔차 표준 편차 ( )의 불확실성을 초래합니다 . 또한, 어떤 값 이 발생 할지 불확실성 이 있습니다. 가 임의 이기 때문에 이러한 추가 불확실성 은 예측을 특징 짓습니다. 예측이있다 볼 (결국, 추정 같이 추정치 :-) 심지어 매우 같은 수학 식 (가질 수 는 때때로 와 동일 할 수 있습니다σ Y ( X ) Y ( X ) α + β X α + β (X) P ( X ) t ( X ) )이지만 예상보다 불확실성이 더 커집니다.
여기서, 그리고, OLS의 예에서는 명확하게 구별 참조 :는 추정 (고정되지만 알 수있다)을 매개로 추측하면서 예측 임의의 양의 값의 추측. 잠재적 혼동의 원인은 예측이 일반적으로 추정 된 모수를 기반으로하며 추정기와 동일한 공식을 가질 수도 있다는 것입니다.
실제로 두 가지 방법으로 추정값과 예측 변수를 구별 할 수 있습니다.
목적 : 추정자는 실제 자연 상태의 속성을 알고 자하는 반면, 예측은 랜덤 변수의 결과를 추측하려고합니다. 과
불확실성 : 예측 변수는 랜덤 변수의 결과에 불확실성이 추가되어 일반적으로 관련 추정량보다 큰 불확실성이 있습니다. 따라서 잘 기록되고 설명 된 예측 변수에는 일반적으로 신뢰 구간이라고 알려진 추정기의 불확실성 대역보다 넓은 불확실성 대역 (예측 간격)이 있습니다. 예측 구간의 특징은 데이터 세트가 커짐에 따라 (가설 적으로) 축소 될 수 있지만 0 구간으로 축소되지는 않습니다 (임의 결과의 불확실성은 "돌이킬 수 없음"). 신뢰 구간의 폭은 충분한 양의 데이터로 추정의 정확도가 임의로 향상 될 수 있다는 직감에 따라 0으로 줄어 듭니다.
이를 잠재적 인 투자 손실 평가에 적용 할 때는 먼저 목적을 고려하십시오. 주어진 기간 동안 이 투자 (또는 이 특정 투자 바스켓)에서 실제로 얼마나 손실을 입을 수 있는지 알고 싶 습니까? 예상되는 손실 (아마도 많은 투자 분야에서)? 전자는 예측이고 후자는 추정입니다. 그런 다음 불확실성을 고려하십시오. 데이터를 수집하고 분석하는 데 거의 무한한 자원이 있다면 어떻게 대답이 바뀌겠습니까? 그것이 매우 정확 해지면 투자에 대한 예상 수익률을 추정 할 수있을 것입니다.
따라서, 어떤 동물을 다루고 있는지 확실하지 않은 경우, 견적 담당자 / 예측 자에게 물어보십시오. 그것이 얼마나 잘못되어 있고 왜 그런가? 기준 (1)과 (2)를 모두 사용하면 자신이 가진 것을 알 수 있습니다.
추정은 항상 알려지지 않은 모수에 대한 것이며 예측은 랜덤 변수에 대한 것입니다.
모델에는 차이가 없습니다. 실제로 수행 된 작업에는 약간의 차이가 있습니다. 추정은 데이터를 사용하여 확률 모델의 교정입니다 (AI 용어의 "학습"). 예측은 미래 관측의 "추측"입니다. 이 "추측"이 과거의 데이터에 근거한다고 가정하면 추정의 경우 일 수 있습니다. 예를 들어 , 인구의 평균 키 추정치 를 사용하여 만날 다음 사람의 키 예측 과 같은 그러나 예측이 항상 예측의 예는 아닙니다. 다음에 만나려는 사람의 성별은 고전적인 의미에서 인구의 매개 변수가 아닙니다. 성별을 예측하려면 약간의 추정이 필요할 수 있지만 좀 더 필요할 것입니다 ...
값-위험에 처한 경우, 당신 이후 예측 및 추정이 일치 예상 손실의 인 추정 손실의 기대.
예측은 표본 회귀 함수를 사용하여 독립 변수의 관찰되지 않은 일부 값에 따라 종속 변수의 값을 추정하는 것입니다.
추정은 모집단의 알 수없는 모수 또는 수량을 계산하는 프로세스 또는 기술입니다.
일반적으로 "추정"은 매개 변수 용으로 예약되고 "예측"은 값용입니다. 그러나 때때로 구별이 흐려지는 경우가 있습니다. 예를 들어 "내일 가치 예측"대신 "내일 가치 추정"과 같은 것을 보았을 수 있습니다.
위험 가치 (VaR)는 흥미로운 사례입니다. VaR은 매개 변수가 아니지만 "VaR 예측"이라고 말하지 않습니다. 우리는 "Vars 추정"이라고 말합니다. 왜?
당신이 분포를 알고, 당신이 경우 그 VaR의의 이유는 임의의 양 아닙니다 필요로 계산 VaR의의 분포를 알 수 있습니다. 따라서 파라 메트릭 VaR 접근법을 사용하는 경우 먼저 분포의 모수를 추정 한 다음 VaR을 계산합니다. 비모수 VaR을 사용하는 경우 매개 변수 추정 방법과 유사한 VaR 을 직접 추정 합니다. 이와 관련하여 Quantile과 유사합니다.
한편, 손실량은 임의의 값이다. 당신이 예측 손실을 요구하는 경우 따라서, 당신은 할 거라고 예측 추정을하지. 다시, 때때로 우리는 "추정"손실을 말합니다. 그래서 앞에서 쓴 것처럼 선이 흐려집니다.
아래 정의가 더 설명되어 있습니다.
추정은 결과의 계산 된 근사치입니다. 이 결과는 예측 일 수 있지만 반드시 그런 것은 아닙니다. 예를 들어, 어제 오후 5시 골든 게이트 브릿지의 차량 수가 마린을 향한 3 개의 차선이 수용 가능하고 각 차량이 30 피트의 공간을 차지하고 다리의 길이가 9000 피트 ( 9000/30 x 3 = 900).
추정은 추정값이 알려진 패턴의 패턴을 따르는 것으로 가정하여 알려진 값 범위 밖의 변수 값을 추정합니다. 가장 단순하고 가장 보편적 인 형태의 외삽 법은 알려진 데이터를 기반으로 선형 추세를 추정하는 것입니다. 선형 외삽의 대안은 다항식과 원뿔 외삽을 포함합니다. 추정과 마찬가지로 외삽을 예측에 사용할 수 있지만 예측에만 국한되지는 않습니다.
예측은 단순히 미래에 대해 말하는 것입니다. 예측은 일반적으로 결과에 중점을 두지 않고 결과에 중점을 둡니다. 예를 들어, 2050 년까지 모든 차량에 2011 년 낮은 채택에서 2050 년까지 완전히 채택하는 방법을 설명하지 않고 전기 모터로 구동 될 것이라고 예측할 수 있습니다. 이전 예에서 볼 수 있듯이 예측이 데이터를 기반으로하는 것은 아닙니다.
예측은 예측 또는 예측 프로세스입니다. 예측과 예측이라는 용어는 종종 상호 교환 적으로 사용되지만 예측은 종종 결과에 대한 경로에 대한 설명을 제공한다는 점에서 예측과 구별됩니다. 예를 들어, 전기 자동차 채택 예측에는 2025 년 이전에 전기 자동차가 거의없고 2030 년에 급격한 채택으로 변곡점이 발생하며 대부분의 자동차가 전기 자동차 인 S 자형 채택 패턴에 따른 완전 전기 자동차 채택 경로가 포함될 수 있습니다. 2040.
추정, 외삽, 예측 및 예측은 상호 철저하고 포괄적 인 용어가 아닙니다. 복잡한 문제에 대한 좋은 장기 예측은 종종 그럴듯한 결과를 얻기 위해 외삽 법 이외의 기술을 사용해야합니다. 예측 및 예측은 어떤 종류의 계산 된 추정 없이도 발생할 수 있습니다.