확률 표기법의 의미

27

많은 책과 논문에서 일반적으로 사용되는 표기법 와 의미 차이는 무엇입니까? $P(z;d,w)$ $P(z|d,w)$

probability notation

— 학습자
소스

13

f (x; θ)는 f (x | θ)와 동일합니다. 단순히 θ는 고정 된 매개 변수이고 함수 f는 x의 함수입니다. f (x, Θ), OTOH는 함수 집합 (집합)의 요소이며 요소는 Θ로 색인됩니다. 미묘한 차이 일 수도 있지만 중요한 것은 esp. 알려진 데이터 x에 기초하여 알려지지 않은 파라미터 θ를 추정 할 때가되면; 그때, θ는 변하고 x는 고정되어 "우도 함수"가된다. "|"의 사용법 통계 학자들 사이에서 더 일반적입니다. ";" 수학자들 사이에서.

— jbowman 2016 년

그렇습니다. jbowman이 맞습니다. 때때로 우리는 그것을 Θ가 주어진 X의 밀도라고 부릅니다.

— Michael R. Chernick 2016 년

@ jbowman 왜 답변으로 게시하지 않습니까? 내 유일한 질문은-왜 두 가지를 모두 사용합니까?하지만 컨텍스트와 관련이 있다고 가정합니다 ( "|"는 "P"및 ";"은 "

f

$f$ " 와 함께 사용됨 ).

— Abe

좋은 생각, 아베; 아마 그거야.

f

$f$ 가 더 일반적이라고 생각합니다.

— jbowman 2016 년

12

나는 이것의 기원이 가능성 패러다임이라고 생각합니다 (아래의 실제 역사적 정확성을 확인하지는 않았지만 iot가 어떻게 생겼는지 이해하는 합리적인 방법입니다).

회귀 설정에서 분포는 p (Y | x, beta)입니다. 즉, x 및 베타 값을 알고있는 경우 조건부로 Y의 분포를 의미합니다.

베타를 추정하려면 가능성을 최대화하려고합니다. L (beta; y, x) = p (Y | x, beta) 본질적으로 이제 p (Y | x, beta) 식을보고 있습니다. 베타 기능이지만, 그 외에는 차이가 없습니다 (수학적으로 올바른 표현을 위해서는 올바르게 도출 할 수 있지만 실제로는 귀찮게하지 않아도됩니다).

그런 다음 베이지안 설정에서 매개 변수와 다른 변수의 차이가 곧 사라져서 두 표기법을 혼합하여 사용하기 시작했습니다.

따라서 본질적으로 실제 차이는 없습니다. 둘 다 왼쪽에있는 것의 조건부 분포를 나타내며 오른쪽에있는 것 (들)을 조건부로 나타냅니다.

— 닉 사브
소스

23

랜덤 변수의 밀도 점에서 와 분포의 매개 변수 인. 는점 에서 와 의 접합 밀도이며 가 임의 변수 인경우에만 의미가있습니다. 는 주어진 의 조건부 분포이며, 다시 한 번만 의미가 있습니다. $f(x;\theta)$ $X$ $x$ $\theta$ $f(x,\theta)$ $X$ $\Theta$ $(x,\theta)$ $\Theta$ $f(x|\theta)$ $X$ $\Theta$ 는 랜덤 변수입니다. 책에 더 들어가서 베이지안 분석을 살펴보면 훨씬 명확 해집니다. $\Theta$

— PeterR
소스

어 - ...

의 조건부 분포

주어진

경우에도 완벽한 이해하게

임의의 변수되지 않습니다.

가 랜덤 변수가 아닌 고전 통계에서는 거의 표준 표기법입니다 .

f (x | θ)

$f(x|\theta)$

x

$x$

θ

$\theta$

θ

$\theta$

θ

$\theta$

— jbowman 2016 년

Uhhhh .... P [Θ = θ] = 1 (왼쪽 Θ는 임의의 변수, 오른쪽 θ는 상수 임)을 의미한다고 해석하면 동의합니다. 그렇지 않으면 ...... 조건부 분포 정의의 분모에서 P [Θ = θ]가 무엇을 의미합니까?

— PeterR

분모? 나는

쓸 수 있습니다. 여기서

는 Bayes 'Rule을 참조하지 않고 정규 분포입니다.

와

는 고정되어 있습니다. ll.mit.edu/mission/communications/ist/publications/… 와 같은 다른 것들도 있습니다.

x \sim f (x | μ, σ)

$x \sim f(x | \mu, \sigma)$

f

$f$

μ

$\mu$

σ

$\sigma$

— jbowman 2016 년

jbowman, μ와 σ가 고정 된 숫자 일 때 조건 밀도로 f (x | μ, σ)의 정의는 무엇입니까?

— PeterR

1

표기법 f (X | Y)와 관련된 단어 "조건부"는 "일부 임의의 이벤트 발생시 조건부"로 정의됩니다. "f (x) 주어진 (특정 값) μ 및 σ"에서와 같이 그냥 "주어진"과 같은 다른 것을 의미하기 위해 그것을 사용한다면, 이것이 바로 표기법 f (x; μ, σ)입니다 입니다. OP가 표기법의 의미에 대해 묻고 있었으므로 답변의 표기법에 대해 정확해야합니다.

— PeterR

18

$f(x;\theta)$ 는 $f(x|\theta)$ 와 동일합니다. 단순히 $\theta$ 는 고정 된 매개 변수이고 함수 $f$ 는 $x$ 의 함수입니다. $f(x,\Theta)$ , OTOH는 함수의 패밀리 (또는 세트)의 요소이며, 요소는 $\Theta$ 로 색인화됩니다. 미묘한 차이 일 수도 있지만 중요한 것은 esp. 알려진 데이터 기초하여 알려지지 않은 파라미터 $\theta$ 를 추정 할 때가되었을 때; 그때, 는 $x$ $\theta$ $x$ 고정되어 "우도 함수"가됩니다. 통계 학자들 사이 에서 $\mid$ 사용법 이 더 일반적이지만 $;$ 수학자들 사이에서.

— 보보 맨
소스

1

어떻게

구두로 말? "f of x given θ"라고하나요?

f (x; θ)

$f(x;θ)$

— stackoverflowuser2010 년

@ stackoverflowuser2010-그렇습니다.

— jbowman

2

나는 일부 코스 라 비디오에서 스탠포드 교수 앤드류 응 (Andrew Ng)이 세미콜론을 "매개 변수에 의해 매개 변수화 한"것으로 구두 화하는 것을 발견했다. class.coursera.org/ml-005/lecture/34를 참조하십시오 . 따라서이 예제는 "theta에 의해 매개 변수화 된 x의 f"로 표시됩니다.

— stackoverflowuser2010 2

5

"주어진"또는 "조건부"라고 말하는 것은 "일반적으로"매개 변수화 된 것과 매우 다릅니다. 누군가가 이것을보고 그 둘이 동등하다고 생각하면 싫어요. "파라미터 화 된"이라고 말하는 것은 컨디셔닝되는 수량이 첫 번째 항에서 변수의 pdf를 인덱싱하는 파라미터 인 경우에만 적합합니다. 두 변수 (예 : f (x; y))의 경우 해당 용어를 사용하는 것이 잘못됩니다.

— ATJ

2

@MikeWilliamson-물론, 모든 것이 무엇을 의미하는지 알고 그것을 고수하는 표기법을 선택하십시오! 그렇게하면 내 경험에서 4 시간 전과 같이 이전에 한 일로 돌아갈 때 "|"를 사용할 때 무슨 의미인지 알 필요가 없습니다. 동의합니다. 성가신 일이지만 잠시 후 표기법의 첫 번째 사용법을 관찰하고 나머지 종이 / 책에 대해 기억하십시오. 어쨌든 구별은 일반적으로 중요한 것이 아닙니다.

— jbowman

9

항상 이런 식으로 된 것은 아니지만 요즘 는 일반적으로 가 임의의 변수가 아닌 경우 (이것은 반드시 알려진 것으로 말할 필요는 없음)입니다. 는 값에 대한 컨디셔닝을 나타냅니다 . 컨디셔닝은 임의의 변수에 대한 작업이며 가 임의의 변수가 아닌 경우이 표기법을 사용하여 혼란스럽고 비극적입니다. $P(z; d, w)$ $d,w$ $P(z | d, w)$ $d,w$ $d, w$

@Nick Sabbe가 지적했듯이 는 관측 된 데이터 의 샘플링 분포에 대한 일반적인 표기법입니다 . 일부 빈번한 사람들은이 표기법을 사용하지만 는 임의의 변수가 아니며, 이는 남용 IMO 라고 주장합니다 . 그러나 그들은 독점권이 없다. 조건부 끝에서 고정 하이퍼 파라미터를 사용하여 베이지안도 그렇게하는 것을 보았습니다. $p(y|X, \Theta)$ $y$ $\Theta$

— JMS
소스

2

두 번째 단락에서 일반적인 통계 상황 (예 : 회귀 모형 적합)에서

는 임의의 변수로 간주되지 않고 알려진 상수 세트로 간주됩니다.

X

$X$

— gung-모니 티 복원