통계 모델 표기법에 대한 "표준"이 있습니까?


10

예를 들어, Lee and Wagenmakers ( pdf ) 의 BUGS 매뉴얼 또는 다음 책과 다른 곳에서는 대부분의 통계 모델을 간결하게 설명하는 데 사용할 수있는 유연성이있는 표기법이 사용됩니다. 이 표기법의 예는 다음과 같습니다.

와이나는이항식(나는,나는)로그(나는1나는)=나는나는표준(μ,σ)

예측 변수는 없지만 그룹 인 계층 적 물류 모델을 설명합니다 . 모델을 설명하는이 방법은 잦은 모델과 베이지안 모델을 설명하는 데 똑같이 잘 작동하는 것처럼 보입니다. 예를 들어,이 모델 설명을 완전히 베이지안으로 만들려면 및 에 사전을 추가해야합니다 .나는=1μσ

이러한 유형의 모델 표기법 / 형식은 일부 기사 나 책에 자세히 설명되어 있습니까?

이 표기법을 사용하여 모델을 작성하려면 여러 가지 방법으로 작업을 수행 할 수 있으며 다른 사람을 따르고 참조하는 포괄적 인 가이드와 함께 사용하면 매우 유용합니다. 사람들이 이러한 유형의 표기법을 사용하는 방법에서 발견 한 몇 가지 차이점 :

  • 배포판이란 무엇입니까? 예를 들어 등을 보았습니다 .,,표준,표준
  • 인덱스를 어떻게 처리합니까? 예를 들어 , , 등을 보았습니다 .와이나는제이와이나는[제이]와이제이|나는
  • 일반적으로 매개 변수에 사용되는 매개 변수 기호 예를 들어 정규 분포의 평균으로 를 사용하는 것이 일반적 이지만 다른 분포는 어떻습니까? (이를 위해 나는 보통 Wikipedia분포를 확인합니다 )μ

후속 질문 : 이 표기법에 이름이 있습니까? (더 나은 이름의 부족을 위해 나는 그것을라는 확률 분포 중심의 대회 A의 블로그 게시물 ... 내가 쓴)

답변:


2

통계 표기법에 대한 일부 권장 표준은 Halperin, Hartley and Hoel (1965)Sanders and Pugh (1972)에 나와 있습니다. 현재 표기법의 대부분은 19 세기 후반과 20 세기 초 생체 통계학자가 설정 한 규칙에서 유래 한 것입니다 (대부분 Pearson and Fisher와 그 동료들이 수행했습니다). 표기법의 조기 사용의 유용한 목록은 경제학자 존 알드리치에 의해 유지되고 여기에 , 그리고 영어 생체 학교의 역사 계정에 게시 알드리치 (2003) . (이 주제에 대한 추가 문의가있는 경우 Aldrich 는 통계 표기법의 역사에서 세계 최고의 전문가입니다.)

이 명시적인 작업 외에도 필드에 대한 소개를 제공하는 많은 책이 있으며 이들은 일반적인 표기법과 일치하는 표기법을 정의하고 표기법을 정의하는 데주의를 기울입니다. 이 분야에는 문헌을 통해 일관되게 잘 알려진 많은 규칙이 있으며, 통계학자는 이러한 연구원의 권장 사항을 읽지 않아도 실습을 통해이를 잘 알고 있습니다.

분포 중심 표기법의 모호성 : "배포 중심"표기법의 사용은 통계 문헌 전체에서 사용되는 표준 규칙입니다. 그러나이 표기법에서 지적해야 할 흥미로운 점 중 하나는 실제로 의미하는 바에 약간의 흔들림이 있다는 것입니다. 표준 규약은 이러한 계산 문의 오른쪽에있는 개체를 확률 측정 (예 : 분포 함수, 밀도 함수 등)에 대한 설명으로 읽은 다음 을 읽는 것입니다."... 분포가있다 ..."또는 "... 확률이있다 ..."등의 관계 왼쪽에있는 개체는 임의의 변수이고 오른쪽에있는 개체는 확률 측정에 대한 설명입니다.

그러나 우변을 임의의 변수에 대한 참조 (분포가 아닌)로 해석하고 관계를 "...와 동일한 분포를 가짐"이라는 의미로 읽는 것도 마찬가지로 유효합니다 . . 이 해석에서 관계는 랜덤 변수를 비교 하는 동등 관계입니다 . 좌변과 우변의 물체는 모두 랜덤 변수이며 관계는 반사적이고 대칭 적이며 전 이적입니다.

이것은 다음과 같은 문장에 대한 두 가지 가능한 (그리고 똑같이 유효한) 해석을 제공합니다.

엑스(μ,σ2).
  • 분포 해석 : " 에는 확률 분포가 있습니다. 이 해석은 후자의 목적이 정규 확률 측정 (예를 들어, 밀도 함수, 분포 함수 등)에 대한 일부 설명이되게한다.N ( μ , σ 2 )엑스(μ,σ2)

  • 랜덤 변수 해석 : " 는 " 와 동일한 확률 분포를 갖습니다 . 이 해석은 후자의 객체를 일반적인 랜덤 변수로 간주합니다.N ( μ , σ 2 )엑스(μ,σ2)

각 해석에는 장단점이 있습니다. 랜덤 변수 해석의 장점은 등가 관계 를 나타 내기 위해 표준 기호 을 사용한다는 것입니다 . 그러나 단점은 분포 함수와 유사한 표기법을 가진 랜덤 변수에 대한 참조가 필요하다는 것입니다. 분포 해석의 장점은 분포 전체에 대해 유사한 표기법을 사용하고 주어진 인수 값을 가진 기능적 형태를 사용한다는 것입니다. 단점은 동등한 관계가 아닌 방식으로 기호를 사용한다는 것입니다.


Aldrich, J. (2003) 영어 생체 인식 학교 국제 통계 검토 의 언어 71 (1) , pp. 109-131.

Halperin, M., Hartley, HO and Hoel, PG (1965) 통계 기호 및 표기법에 대한 권장 표준 . 미국 통계 학자 19 (3) , pp. 12-14.

Sanders, JR and Pugh, RC (1972) 표준 통계 기호 및 표기법 세트에 대한 권장 사항 . 교육 연구원 1 (11) , 15-16 쪽.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.