확률 표기법의 의미


27

많은 책과 논문에서 일반적으로 사용되는 표기법 와 의미 차이는 무엇입니까?P(z;d,w)P(z|d,w)


13
f (x; θ)는 f (x | θ)와 동일합니다. 단순히 θ는 고정 된 매개 변수이고 함수 f는 x의 함수입니다. f (x, Θ), OTOH는 함수 집합 (집합)의 요소이며 요소는 Θ로 색인됩니다. 미묘한 차이 일 수도 있지만 중요한 것은 esp. 알려진 데이터 x에 기초하여 알려지지 않은 파라미터 θ를 추정 할 때가되면; 그때, θ는 변하고 x는 고정되어 "우도 함수"가된다. "|"의 사용법 통계 학자들 사이에서 더 일반적입니다. ";" 수학자들 사이에서.
jbowman 2016 년

그렇습니다. jbowman이 맞습니다. 때때로 우리는 그것을 Θ가 주어진 X의 밀도라고 부릅니다.
Michael R. Chernick 2016 년

@ jbowman 왜 답변으로 게시하지 않습니까? 내 유일한 질문은-왜 두 가지를 모두 사용합니까?하지만 컨텍스트와 관련이 있다고 가정합니다 ( "|"는 "P"및 ";"은 " f " 와 함께 사용됨 ).
Abe

좋은 생각, 아베; 아마 그거야. f 가 더 일반적이라고 생각합니다.
jbowman 2016 년

답변:


12

나는 이것의 기원이 가능성 패러다임이라고 생각합니다 (아래의 실제 역사적 정확성을 확인하지는 않았지만 iot가 어떻게 생겼는지 이해하는 합리적인 방법입니다).

회귀 설정에서 분포는 p (Y | x, beta)입니다. 즉, x 및 베타 값을 알고있는 경우 조건부로 Y의 분포를 의미합니다.

베타를 추정하려면 가능성을 최대화하려고합니다. L (beta; y, x) = p (Y | x, beta) 본질적으로 이제 p (Y | x, beta) 식을보고 있습니다. 베타 기능이지만, 그 외에는 차이가 없습니다 (수학적으로 올바른 표현을 위해서는 올바르게 도출 할 수 있지만 실제로는 귀찮게하지 않아도됩니다).

그런 다음 베이지안 설정에서 매개 변수와 다른 변수의 차이가 곧 사라져서 두 표기법을 혼합하여 사용하기 시작했습니다.

따라서 본질적으로 실제 차이는 없습니다. 둘 다 왼쪽에있는 것의 조건부 분포를 나타내며 오른쪽에있는 것 (들)을 조건부로 나타냅니다.


23

랜덤 변수의 밀도 X 점에서 X θ는 분포의 매개 변수 인. f ( x , θ ) 는점 ( x , θ ) 에서 X Θ 의 접합 밀도이며 Θ 가 임의 변수 인경우에만 의미가있습니다. f ( x | θ ) Θ가 주어진 X 의 조건부 분포이며, 다시 한 번만 의미가 있습니다.f(x;θ)Xxθf(x,θ)XΘ(x,θ)Θf(x|θ)XΘ 는 랜덤 변수입니다. 책에 더 들어가서 베이지안 분석을 살펴보면 훨씬 명확 해집니다.Θ


어 - ... 의 조건부 분포 X 주어진 θ이 경우에도 완벽한 이해하게 θ는 임의의 변수되지 않습니다. θ 가 랜덤 변수가 아닌 고전 통계에서는 거의 표준 표기법입니다 . f(x|θ)xθθθ
jbowman 2016 년

Uhhhh .... P [Θ = θ] = 1 (왼쪽 Θ는 임의의 변수, 오른쪽 θ는 상수 임)을 의미한다고 해석하면 동의합니다. 그렇지 않으면 ...... 조건부 분포 정의의 분모에서 P [Θ = θ]가 무엇을 의미합니까?
PeterR

분모? 나는 쓸 수 있습니다. 여기서 f 는 Bayes 'Rule을 참조하지 않고 정규 분포입니다. μσ 는 고정되어 있습니다. ll.mit.edu/mission/communications/ist/publications/… 와 같은 다른 것들도 있습니다. xf(x|μ,σ)fμσ
jbowman 2016 년

jbowman, μ와 σ가 고정 된 숫자 일 때 조건 밀도로 f (x | μ, σ)의 정의는 무엇입니까?
PeterR

1
표기법 f (X | Y)와 관련된 단어 "조건부"는 "일부 임의의 이벤트 발생시 조건부"로 정의됩니다. "f (x) 주어진 (특정 값) μ 및 σ"에서와 같이 그냥 "주어진"과 같은 다른 것을 의미하기 위해 그것을 사용한다면, 이것이 바로 표기법 f (x; μ, σ)입니다 입니다. OP가 표기법의 의미에 대해 묻고 있었으므로 답변의 표기법에 대해 정확해야합니다.
PeterR

18

f(x;θ)f(x|θ) 와 동일합니다. 단순히θ 는 고정 된 매개 변수이고 함수fx 의 함수입니다. f(x,Θ) , OTOH는 함수의 패밀리 (또는 세트)의 요소이며, 요소는Θ 로 색인화됩니다. 미묘한 차이 일 수도 있지만 중요한 것은 esp. 알려진 데이터 x에 기초하여 알려지지 않은 파라미터θ 를 추정 할 때가되었을 때; 그때, θ 변하고 xxθx고정되어 "우도 함수"가됩니다. 통계 학자들 사이 에서 사용법 이 더 일반적이지만 ;수학자들 사이에서.


1
어떻게 구두로 말? "f of x given θ"라고하나요? f(x;θ)
stackoverflowuser2010 년

@ stackoverflowuser2010-그렇습니다.
jbowman

2
나는 일부 코스 라 비디오에서 스탠포드 교수 앤드류 응 (Andrew Ng)이 세미콜론을 "매개 변수에 의해 매개 변수화 한"것으로 구두 화하는 것을 발견했다. class.coursera.org/ml-005/lecture/34를 참조하십시오 . 따라서이 예제는 "theta에 의해 매개 변수화 된 x의 f"로 표시됩니다.
stackoverflowuser2010 2

5
"주어진"또는 "조건부"라고 말하는 것은 "일반적으로"매개 변수화 된 것과 매우 다릅니다. 누군가가 이것을보고 그 둘이 동등하다고 생각하면 싫어요. "파라미터 화 된"이라고 말하는 것은 컨디셔닝되는 수량이 첫 번째 항에서 변수의 pdf를 인덱싱하는 파라미터 인 경우에만 적합합니다. 두 변수 (예 : f (x; y))의 경우 해당 용어를 사용하는 것이 잘못됩니다.
ATJ

2
@MikeWilliamson-물론, 모든 것이 무엇을 의미하는지 알고 그것을 고수하는 표기법을 선택하십시오! 그렇게하면 내 경험에서 4 시간 전과 같이 이전에 한 일로 돌아갈 때 "|"를 사용할 때 무슨 의미인지 알 필요가 없습니다. 동의합니다. 성가신 일이지만 잠시 후 표기법의 첫 번째 사용법을 관찰하고 나머지 종이 / 책에 대해 기억하십시오. 어쨌든 구별은 일반적으로 중요한 것이 아닙니다.
jbowman

9

항상 이런 식으로 된 것은 아니지만 요즘 는 일반적으로 d , w 가 임의의 변수가 아닌 경우 (이것은 반드시 알려진 것으로 말할 필요는 없음)입니다. P ( z | d , w )d , w의 값에 대한 컨디셔닝을 나타냅니다 . 컨디셔닝은 임의의 변수에 대한 작업이며 d , w 가 임의의 변수가 아닌 경우이 표기법을 사용하여 혼란스럽고 비극적입니다.P(z;d,w)d,wP(z|d,w)d,wd,w

@Nick Sabbe가 지적했듯이 는 관측 된 데이터 y 의 샘플링 분포에 대한 일반적인 표기법입니다 . 일부 빈번한 사람들은이 표기법을 사용하지만 Θ 는 임의의 변수가 아니며, 이는 남용 IMO 라고 주장합니다 . 그러나 그들은 독점권이 없다. 조건부 끝에서 고정 하이퍼 파라미터를 사용하여 베이지안도 그렇게하는 것을 보았습니다.p(y|X,Θ)yΘ


2
두 번째 단락에서 일반적인 통계 상황 (예 : 회귀 모형 적합)에서 는 임의의 변수로 간주되지 않고 알려진 상수 세트로 간주됩니다. X
gung-모니 티 복원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.