많은 책과 논문에서 일반적으로 사용되는 표기법 와 의미 차이는 무엇입니까?
많은 책과 논문에서 일반적으로 사용되는 표기법 와 의미 차이는 무엇입니까?
답변:
나는 이것의 기원이 가능성 패러다임이라고 생각합니다 (아래의 실제 역사적 정확성을 확인하지는 않았지만 iot가 어떻게 생겼는지 이해하는 합리적인 방법입니다).
회귀 설정에서 분포는 p (Y | x, beta)입니다. 즉, x 및 베타 값을 알고있는 경우 조건부로 Y의 분포를 의미합니다.
베타를 추정하려면 가능성을 최대화하려고합니다. L (beta; y, x) = p (Y | x, beta) 본질적으로 이제 p (Y | x, beta) 식을보고 있습니다. 베타 기능이지만, 그 외에는 차이가 없습니다 (수학적으로 올바른 표현을 위해서는 올바르게 도출 할 수 있지만 실제로는 귀찮게하지 않아도됩니다).
그런 다음 베이지안 설정에서 매개 변수와 다른 변수의 차이가 곧 사라져서 두 표기법을 혼합하여 사용하기 시작했습니다.
따라서 본질적으로 실제 차이는 없습니다. 둘 다 왼쪽에있는 것의 조건부 분포를 나타내며 오른쪽에있는 것 (들)을 조건부로 나타냅니다.
랜덤 변수의 밀도 X 점에서 X 와 θ는 분포의 매개 변수 인. f ( x , θ ) 는점 ( x , θ ) 에서 X 와 Θ 의 접합 밀도이며 Θ 가 임의 변수 인경우에만 의미가있습니다. f ( x | θ ) 는 Θ가 주어진 X 의 조건부 분포이며, 다시 한 번만 의미가 있습니다. 는 랜덤 변수입니다. 책에 더 들어가서 베이지안 분석을 살펴보면 훨씬 명확 해집니다.
는 와 동일합니다. 단순히 는 고정 된 매개 변수이고 함수 는 의 함수입니다. , OTOH는 함수의 패밀리 (또는 세트)의 요소이며, 요소는 로 색인화됩니다. 미묘한 차이 일 수도 있지만 중요한 것은 esp. 알려진 데이터 x에 기초하여 알려지지 않은 파라미터 를 추정 할 때가되었을 때; 그때, θ 는 변하고 x고정되어 "우도 함수"가됩니다. 통계 학자들 사이 에서 사용법 이 더 일반적이지만 수학자들 사이에서.
항상 이런 식으로 된 것은 아니지만 요즘 는 일반적으로 d , w 가 임의의 변수가 아닌 경우 (이것은 반드시 알려진 것으로 말할 필요는 없음)입니다. P ( z | d , w ) 는 d , w의 값에 대한 컨디셔닝을 나타냅니다 . 컨디셔닝은 임의의 변수에 대한 작업이며 d , w 가 임의의 변수가 아닌 경우이 표기법을 사용하여 혼란스럽고 비극적입니다.
@Nick Sabbe가 지적했듯이 는 관측 된 데이터 y 의 샘플링 분포에 대한 일반적인 표기법입니다 . 일부 빈번한 사람들은이 표기법을 사용하지만 Θ 는 임의의 변수가 아니며, 이는 남용 IMO 라고 주장합니다 . 그러나 그들은 독점권이 없다. 조건부 끝에서 고정 하이퍼 파라미터를 사용하여 베이지안도 그렇게하는 것을 보았습니다.