통계 모델과 확률 모델의 차이점은 무엇입니까?


29

응용 확률은 계산 확률을 포함하여 확률의 중요한 분기입니다. 통계는 확률 이론을 사용하여 데이터를 다루는 모델을 구성하므로 이해하는 바와 같이 통계 모델과 확률 모델의 본질적인 차이점이 무엇인지 궁금합니다. 확률 모델에 실제 데이터가 필요하지 않습니까? 감사.

답변:


29

확률 모델 삼중 구성 여기서 샘플 공간이다 인 -algebra (건) 및 는 의 확률 측정 값입니다 .(Ω,F,P)ΩFσPF

직관적 인 설명 . 확률 모델은 알려진 랜덤 변수 로 해석 될 수 있습니다 . 예를 들어, 를 평균 과 분산 갖는 정규 분포 랜덤 변수로 지정하십시오 . 이 경우 확률 측정 는 누적 분포 함수 (CDF) ~X0 1 P FX01PF

F(x)=P(Xx)=P(ωΩ:X(ω)x)=x12πexp(t22)dt.

일반화 . 확률 모델의 정의는 확률의 수학적 정의에 따라 다릅니다 (예 : 자유 확률양자 확률 참조) .

통계 모델은 A는 세트 이된다 확률 대책들의 세트 확률 모델 / 샘플 공간 분포 . ΩSΩ

이 확률 분포는 일반적으로 데이터가있는 특정 현상을 모델링하기 위해 선택됩니다.

직관적 인 설명 . 통계 모델에서 특정 현상을 설명하는 모수 및 분포는 모두 알려져 있지 않습니다. 이에 대한 예는 평균 과 분산 인 정규 분포의 친숙 함 입니다. 두 매개 변수를 모두 알 수 일반적으로 매개 변수 추정을 위한 데이터 세트 (예 : 요소 선택 ) 이 분포 세트는 모든 및 에서 선택할 수 있지만 실수하지 않은 경우 실제 예에서 동일한 쌍 정의 된 것만 합리적입니다. 치다. σ 2R + S Ω F ( Ω , F )μRσ2R+SΩF(Ω,F)

일반화 . 이 논문 은 통계 모델의 매우 공식적인 정의를 제공하지만 저자는 "베이지안 모델은 사전 분포 형태의 추가 구성 요소를 필요로한다. 비록 베이 시안 공식은이 논문의 주요 초점은 아니지만"라고 언급했다. 따라서 통계 모델의 정의는 우리가 사용하는 모델의 종류 (모수 또는 비모수)에 따라 다릅니다. 또한 파라 메트릭 설정에서 정의는 매개 변수가 처리되는 방법 (예 : 클래식 대 베이지안)에 따라 다릅니다.

차이는 다음과 같습니다 확률 모델에 당신은 예를 들어, 정확하게 확률 측정을 알고 , μ 0 , σ 2 0 매개 변수 알려진, 통계 모델은 분포의 세트를 생각하면서. 예를 들어, 보통 ( μ , σ 2 ) , 여기서 μ , σ 2 는 알려지지 않은 파라미터입니다.Normal(μ0,σ02)μ0,σ02Normal(μ,σ2)μ,σ2

그들 중 어느 것도 데이터 세트를 필요로하지 않지만 통계 모델은 일반적으로 모델링을 위해 선택된다고 말하고 싶습니다.


2
@HonglangWang 어느 정도 맞습니다. 주요 차이점은 확률 모델은 하나의 알려진 분포이며 통계 모델은 확률 모델의 집합입니다. 데이터는이 세트에서 모델을 선택하는 데 사용되거나 (데이터의 관점에서) 현상을 더 잘 설명 할 수있는 더 작은 모델의 하위 세트를 선택하는 데 사용됩니다.

2
(+1) 이것은 몇 가지 의견이 있지만 좋은 답변입니다. 첫째, 이것이 프로 베이비리스트를 조금 짧게 팔고 있다고 생각합니다. 확률 모델에서 일련의 확률 공간을 고려하는 것은 전혀 드문 일이 아니며 실제로 가능한 측정 값은 임의적 일 수 있습니다 (적절한 더 큰 공간에서 구성됨). 둘째, 베이지안 (특히 베이지안)은 베이지안 통계 모델이 종종 적절한 제품 공간 에서 단일 확률 모델로 볼 수 있다는 점에서이 답변이 약간 당혹 스러울 수 있습니다 . Ω×Θ
추기경

1
@gung 이것은 더 측정 이론 관련 질문입니다. 첫 번째 질문과 관련하여 는 실제로 CDF를 통해 정의됩니다. 이제 해석 Ω는 , 정식 때문에 어려운 일이다 P ( X X ) 수단 P ( ω Ω : X ( ω ) X ) 다음, Ω는 관측 값이 아니다. F는 A는 σ - 보렐에의 사전 이미지 대수 σ - 대수 미만 XPΩP(Xx)P(ωΩ:X(ω)x)ΩFσσX다시 이것은 관찰 할 수 없습니다. 이것을 직관적 인 수준으로 설명하는 방법을 잘 모르겠습니다.

2
@gung 애플리케이션에 따라 다릅니다 . 이론에 의해 결정되지 않습니다. 예를 들어, Ω 은 금융 파생 상품의 가격을 설명하는 브라운 운동 세트 일 수 있으며 X 는 고정 된 시간 t 에서 얻은 값일 수 있습니다 . 다른 응용에서 Ω 은 사람들의 집합 이 될 수 있고 X 는 팔뚝의 길이가 될 수 있습니다. 일반적으로, Ω는 의 수학적 모델 물리적 연구의 목적 및 X는 해당 개체의 숫자 속성입니다. F 는 가능한 사건들의 집합입니다. 우리가 확률을 밝히고 자하는 상황입니다.ΩΩXtΩXΩXF
whuber

2
@gung 시그마 대수입니다 . 부분 집합 ( "이벤트")의 모음입니다. 금융 응용 프로그램에서는 일련의 가격 내역입니다. 팔뚝 측정 어플리케이션에서 이벤트는 사람들의 집합입니다 . 대화방에서 원하는 경우 더 자세히 이야기 할 수 있습니다. F
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.