범주 형 분포 란 무엇입니까?


12

이 별도의 분포 유형 (예 : 이항, 베르누이, 다항식)이거나 모든 분포를 이런 식으로 나타낼 수 있습니다. 누군가 간단한 예를 들어 설명 할 수 있습니까?

답변:


12

범주 형 분포는 고정 된 수의 베르누이 분포의 일반화 2k 성과.

마찬가지로, "선택" n 의 수가 n1로 고정 된 다항 분포의 특수한 경우입니다 .

따라서 pdf가 있습니다.

i=1kpixi(where 0pi and ipi=1)
지원
xi{0,1}
에 대해 \ prod_ {i = 1} ^ k p_i ^ {x_i} \ qquad \ text {(여기서 $ 0 \ le p_i $ 및 $ \ sum_i p_i = 1 $)}
ni=1kxi=1.

요약하면, 베르누이에는 k=2,n=1 , 이항에는 k=2,n1 , 다항식에는 k2,n1 , 범주 형에는 k2,n=1 있습니다.


xi = 0,1이 필요합니다. 그 이상이 될 수 없습니다.
subha

@ subha : 범주 형 분포에 대한 나의 이해는 그렇게합니다. 다항식과 이항의 경우 물론 가능합니다.
Neil G

5

범주 형 변수에는 유한 한 이산 값 세트가 있습니다. 예를 들어 성별 (남성 / 여성), 국가, 행성 등이 있습니다.이를 연속 변수와 대조하면 무한한 수의 다른 값을 취할 수 있습니다. 예를 들어 체중, 경도, 거리 등이 있습니다.

유사한 정보는 때때로 범주적이고 연속적인 방식으로 표현 될 수 있습니다. 예를 들어 planet = earth로 표현 될 수 있습니다 distance to sun = 1 astronomical unit ≈ 150 million kilometers. 그러나 행성이 없기 때문에 태양에서 2 억 킬로미터를 태양에서 표현할 수있는 방법은 없습니다. 화성은 태양에서 2 억 2,200 만 킬로미터입니다. 2 천 1 백만 km, 202 등에서도 동일합니다 planet = none. 행성과 관련하여이 거리에 대해 말할 수있는 모든 것은 ; 당신은 말할 수 planet = 4/3×earth또는 .88×Mars행성이나 다른 범주 형 변수를 곱 할 의미있는 방법이 없기 때문에. 행성과 관련하여,이 거리는 구분할 수 없지만 물론 태양과는 거리가 멀어지면서 연속적인 변수로 표현됩니다.

하나는 또한 임의의 정밀도로 연속 변수를 표현할 수 있습니다 (예 : 하나의 천문 단위는 정확히 1 억 5 천만 km가 아닌 149,597,871km입니다). 반대로 planet = earth더 정확하게 표현할 방법이 없습니다 . 지구는 더 이상 지구가 아닙니다. 또한 planet명목상의 변수 라면 다른 어떤 행성도 지구보다 "더 많거나"적다는 말은 의미가 없습니다 . 행성은 태양과의 거리, 부피, 달 수 등의 순서로 정렬됩니다.이 숫자는 모두 고유 한 용어로 연속적입니다 (또는 최소한 이산 적입니다). 그러나 범주적인 것은 아니지만 행성의 관점에서는 아닙니다. 예를 들어, 행성들이 태양으로부터의 거리 또는 달 수에 의해 정렬된다면, mars > earth > venus. 행성을 수량별로 주문하면earth > venus > mars. 범주 형 변수를 주문할 필요는 없으며, 일부는 정렬 할 수 없지만 순서를 추가해도 더 적은 범주 형은 아닙니다.

Wikipedia에서 알 수 있듯이 범주 형 분포는 Bernoulli 분포를 두 가지 이상의 가능한 값으로 일반화 한 것입니다 (Beroulli 분포는 엄격하게 이진입니다). Bernoulli 분포는 이항 분포의 특별한 경우이지만 이항 분포를 범주 형이라고 부르지는 않습니다 (이산 적이지만 카운트 변수이므로 값 사이의 거리가 정의됩니다). 다항 분포는 범주 형 분포와 함께 표시 될 수 있지만 Wikipedia는 이에 대해주의합니다 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.