답변:
범주 형 분포는 고정 된 수의 베르누이 분포의 일반화 성과.
마찬가지로, "선택" n 의 수가 1로 고정 된 다항 분포의 특수한 경우입니다 .
따라서 pdf가 있습니다.
요약하면, 베르누이에는 , 이항에는 , 다항식에는 , 범주 형에는 있습니다.
범주 형 변수에는 유한 한 이산 값 세트가 있습니다. 예를 들어 성별 (남성 / 여성), 국가, 행성 등이 있습니다.이를 연속 변수와 대조하면 무한한 수의 다른 값을 취할 수 있습니다. 예를 들어 체중, 경도, 거리 등이 있습니다.
유사한 정보는 때때로 범주적이고 연속적인 방식으로 표현 될 수 있습니다. 예를 들어 planet = earth
로 표현 될 수 있습니다 distance to sun = 1 astronomical unit ≈ 150 million kilometers
. 그러나 행성이 없기 때문에 태양에서 2 억 킬로미터를 태양에서 표현할 수있는 방법은 없습니다. 화성은 태양에서 2 억 2,200 만 킬로미터입니다. 2 천 1 백만 km, 202 등에서도 동일합니다 planet = none
. 행성과 관련하여이 거리에 대해 말할 수있는 모든 것은 ; 당신은 말할 수 planet = 4/3×earth
또는 .88×Mars
행성이나 다른 범주 형 변수를 곱 할 의미있는 방법이 없기 때문에. 행성과 관련하여,이 거리는 구분할 수 없지만 물론 태양과는 거리가 멀어지면서 연속적인 변수로 표현됩니다.
하나는 또한 임의의 정밀도로 연속 변수를 표현할 수 있습니다 (예 : 하나의 천문 단위는 정확히 1 억 5 천만 km가 아닌 149,597,871km입니다). 반대로 planet = earth
더 정확하게 표현할 방법이 없습니다 . 지구는 더 이상 지구가 아닙니다. 또한 planet
명목상의 변수 라면 다른 어떤 행성도 지구보다 "더 많거나"적다는 말은 의미가 없습니다 . 행성은 태양과의 거리, 부피, 달 수 등의 순서로 정렬됩니다.이 숫자는 모두 고유 한 용어로 연속적입니다 (또는 최소한 이산 적입니다). 그러나 범주적인 것은 아니지만 행성의 관점에서는 아닙니다. 예를 들어, 행성들이 태양으로부터의 거리 또는 달 수에 의해 정렬된다면, mars > earth > venus
. 행성을 수량별로 주문하면earth > venus > mars
. 범주 형 변수를 주문할 필요는 없으며, 일부는 정렬 할 수 없지만 순서를 추가해도 더 적은 범주 형은 아닙니다.
Wikipedia에서 알 수 있듯이 범주 형 분포는 Bernoulli 분포를 두 가지 이상의 가능한 값으로 일반화 한 것입니다 (Beroulli 분포는 엄격하게 이진입니다). Bernoulli 분포는 이항 분포의 특별한 경우이지만 이항 분포를 범주 형이라고 부르지는 않습니다 (이산 적이지만 카운트 변수이므로 값 사이의 거리가 정의됩니다). 다항 분포는 범주 형 분포와 함께 표시 될 수 있지만 Wikipedia는 이에 대해주의합니다 .