랜덤 변수를 언제 평균으로 바꿀 수 없습니까?


10

모델링 및 시뮬레이션에서 자주 단순화하는 것은 임의의 변수를 평균값으로 대체하는 것입니다.

이 단순화가 언제 잘못된 결론으로 ​​이어질 것입니까?


2
"Var"는 변수 또는 분산 또는 Value At Risk를 의미 합니까?
Henry

3
회원의 Netflix 구독 요금을 지불하는 서비스를 시작하는 것은 재미있을 것입니다. 우리는 충전 것 여기서 무작위 영역에서 선택 그래서, 나중에 알고, 무료 Netflix! 나중에 일부 고객에게 지불 옵션을 제공 할 것 입니다. |x| USDmonthx[100,100]x2 USDmonth
Nat

3
아주 간단한 경우에 우리가 극단적으로 가져 가면 우리가 관심있는 모든 정보를 거의 잃을 수 있습니다. Y와 X를 모두 평균으로 대체 한 X에서 Y의 회귀를 고려하십시오. 경사에 대한 모든 정보가 손실됩니다.
Dason

1
결 측값 대체에 대해 질문하거나 특정 컨텍스트에서 무작위 변수를 대체하는 것에 대해 질문하고 있습니까 (예 : 무작위 효과 모델을 기반으로 예측하기)?
IWS

답변:


20

결 측값을 특정 포인트 추정치로 바꾸면 모든 변동성을 무시합니다. 따라서 모든 원래 변동성을 모델에 전파하지는 않습니다. 모수 추정값에 가 너무 낮은 것으로 나타납니다 . 추론하면 p 값이 낮게 바이어스됩니다. 귀하의 의 너무 좁은 것입니다. 예측을하면 예측 이 너무 좁아집니다.

전반적으로 : 당신은 당신의 결론을 너무 확신합니다.


2
좋은 대답입니다! 다음과 같이 생각하십시오 : 랜덤 변수에는 분포가 있습니다. 왼쪽, 오른쪽으로 꼬일 수 있습니다. 나는 바이 모달 등일 수 있습니다. 변수를 평균값으로 줄임으로써 모든 추가 정보 (불확실성)를 제거하고 분포 (간격)를 단일 포인트 추정값으로 대체합니다.
elevendollar

1
결 측값을 특정 포인트 추정치로 바꾸면 데이터가 무작위로 누락되었다고 가정합니다. 랜덤 변수의 평균값은 데이터가없는 경우 데이터의 평균값과 같지 않을 수 있습니다.
Neil G

@NeilG nitpick은 유감이지만, 결 측값을 평균으로 대체한다고해서 데이터가 무작위로 누락되었다고 가정하는 것은 아닙니다. 특히 누락 된 데이터와 관련하여 다소 혼란스러운 용어는 '임의로 누락'이 다른 알려진 데이터 ( en.wikipedia.org/wiki/Missing_data ) 에서 임의 조건에서 누락 된 데이터로 간주 합니다. IMO는 데이터를 교체하는 방식이 그 뒤에있는 추론에 대해 아무 것도 암시하지 않습니다. 이러한 추론은 명시 적으로 이루어져야하며 누락 된 데이터를 처리하는 적절한 방법으로 이어져야합니다. 나는 Stephan의 대답에 전적으로 동의합니다.
IWS

@IWS 누락 표시기가 관측 된 데이터에 대해 조건부 인 것이 좋습니다. 임의로 누락은 누락 표시기가 관찰되지 않은 데이터에 의존한다는 것을 의미합니다. 변수를 관찰중인 조건에 따라 평균값으로 바꾸면 데이터가 임의로 누락되지 않는 한 무조건 평균값과 같지 않을 수 있습니다.
Neil G

@NeilG 마지막 주석의 마지막 문장에 '임의로 누락'을 쓸 때 '임의로 완전히 누락'을 의미하지 않습니까? 그렇다면 우리는 동의하지만, 용어에 대해서는 별다른 언급이 없었습니다. (위의 의견에 언급 한 위키 페이지를 참조하십시오. 나는 항상 그 용어를 배우고 읽고 사용했습니다)
IWS

13

Stephan의 포인트 외에도 :

  • 랜덤 변수의 비선형 함수에 관심이있는 거의 모든 응용 분야에서 평균을 대체하면 일반적으로 편향과 모순되는 결과가 발생합니다. 에너지는 V ^ 2로 스케일되기 때문에, 입자의 평균 속도 및 평균 질량은 일반적으로 평균 운동 에너지와 일치하지 않을 것이다.
  • 평균값은 랜덤 변수에 대해 가능한 결과가 아닐 수도 있습니다. 가능한 결과가 0 "환자 사망"및 1 "환자 생활"인 경우, 환자를 0.1 "대부분 사망했지만 약간 살아있다"고 설명하는 모델을 갖는 것이 도움이되지 않습니다.


1
@Alexis 그러나 물론!
Geoffrey Brent

0

금융 시장에서의 실제 사례 (귀하가 얻은 두 가지 답변과 관련됨). 옵션의 가격은 자산의 가격이 주어진 수준보다 높거나 낮을 확률에 기초합니다.

예를 들어, 자산의 예상 가치가 80 일 때 자산을 가격 100으로 구매하는 옵션의 가격입니다. 랜덤 변수 (자산 가격)를 평균으로 대체하면 가격이 0이됩니다. 비용이 80 인 자산은 100이 될 수 없습니다. 자산의 확률을 고려하면 자산 가격이 100을 초과 할 가능성이 있기 때문에 긍정적 인 가격을 얻게됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.