많은 PDF는 마이너스에서 양의 무한대까지 다양하지만 일부 수단은 정의되어 있지만 일부는 정의되지 않았습니다. 어떤 공통적 인 특성으로 계산할 수 있습니까?
많은 PDF는 마이너스에서 양의 무한대까지 다양하지만 일부 수단은 정의되어 있지만 일부는 정의되지 않았습니다. 어떤 공통적 인 특성으로 계산할 수 있습니까?
답변:
분포의 평균은 적분의 관점에서 정의됩니다 (즉, Riemann의 적분과 같이 연속 분포의 경우와 같이 작성하지만 문제가 더 일반적으로 적용됩니다 .Stieltjes 또는 Lebesgue 통합으로 진행할 수 있습니다. 이것들을 올바르게 그리고 한 번에 모두) :
그러나 그것은 무엇을 의미합니까? 효과적으로 속기입니다
또는
(0이 아닌 어디에서나 깨뜨릴 수 있지만)
이러한 적분의 한계가 유한하지 않은 경우 문제가 발생합니다.
예를 들어, 비례하는 표준 Cauchy 밀도를 고려 하십시오.
하자 그래서 d u = 2 x
유한하지 않습니다. 하반기의 한계도 유한하지 않습니다. 따라서 기대치는 정의되지 않습니다.
또는 임의 변수로 표준 Cauchy의 절대 값을 가졌다면 전체 기대 값은 방금 살펴본 한도에 비례합니다 (예 : ).
다른 한편으로, 일부 다른 밀도는 "무한대까지"계속되지만 그 적분에는 한계가 있습니다.
다른 답변은 좋지만 모든 사람, 특히 Cauchy 분포 ( )를 한 사람이 평균 이 0 이어야 한다는 것은 직관적으로 분명하다고 말하지 않을 수 있습니다.
수학적 관점에서 직관적 인 답변이 정확하지 않은 이유는 Riemann 재 배열 정리 (비디오) 때문 입니다.
Cauchy를보고 평균 "제로"를 말할 때 실제로하고있는 일은 "중심"을 0으로 분할 한 다음 두 크기의 균형을 잡는 것입니다. 다시 말해서, 당신은 암시 적으로 긍정적 인 용어 "반쪽"(각 오른쪽 점의 순간)과 음의 용어 "반쪽"(왼쪽의 순간)으로 무한한 합계를하고 있다고 주장합니다. 0으로 합산합니다. (기술적으로 생각하면 )
Riemann 재배치 정리에 따르면 이러한 유형의 무한 합 (양수와 음수를 모두 갖는 하나)은 두 계열 (양수 항만 및 음수 항만)이 독립적으로 취해질 때 각각 수렴하는 경우에만 일관성이 있다고합니다. 양변 (양수와 음수)이 서로 다른 경우, 당신은 어떤 수로 합계되도록 항의 합산 순서를 생각해 낼 수 있습니다. (위의 비디오, 6:50부터 시작)
따라서 0에서 균형 잡힌 방식으로 합산을 수행하면 Cauchy 분포의 첫 번째 순간이 취소됩니다. 그러나 평균의 (표준) 정의는이 합산 순서를 강제하지 않습니다. 모멘트를 임의의 순서로 합산 할 수 있어야하며 동일하게 유효해야합니다. 따라서 Cauchy 분포의 평균은 정의되어 있지 않습니다. 순간을 합산하는 방법을 신중하게 선택하면 사실상 어느 시점에서나 "균형"(또는 불균형)으로 만들 수 있습니다.
따라서 분포의 평균을 정의하려면 두 모멘트 적분이 각각 제안 된 평균 주위에 독립적으로 수렴 (유한)해야합니다 (수학을 할 때 실제로는 완전 적분 ( 수렴되어야합니다). 꼬리가 한 쪽의 모멘트를 무한정으로 만들기에 충분한 "뚱뚱한"상태라면 끝입니다. 반대편에서는 무한한 순간과 균형을 맞출 수 없습니다.
나는 Cauchy 분포와 같은 것들의 "카운터 직관적"행동은 전적으로 무한대에 대해 생각할 때 문제로 인한 것이라고 언급해야합니다. Cauchy 분포를 취하고 xkcd 수의 플러스 / 마이너스와 같이 임의로 먼 거리까지 꼬리를 잘라 내고 (정규화 한 후에는) 갑자기 동작하고 정의 된 평균을 갖는 무언가를 얻습니다. 문제는 뚱뚱한 꼬리 자체가 아니라 무한대에 접근 할 때 꼬리가 어떻게 행동하는지입니다.
Abrial 장군과 Glen_b는 완벽한 답을 얻었습니다. Cauchy 분포가 존재하지 않거나 수렴하지 않는 평균을 보여주기 위해 작은 데모를 추가하고 싶습니다.
다음 실험에서는 큰 표본을 얻어 표본으로부터 경험적 평균을 계산하더라도 수치는 실험마다 상당히 다릅니다.
set.seed(0)
par(mfrow=c(1,2))
experiments=rep(1e5,100)
mean_list_cauchy=sapply(experiments, function(n) mean(rcauchy(n)))
mean_list_normal=sapply(experiments, function(n) mean(rnorm(n)))
plot(mean_list_cauchy,ylim=c(-10,10))
plot(mean_list_normal,ylim=c(-10,10))
우리는 실험을하고 각 실험 에서 두 분포에서 점을 샘플링합니다. 이러한 표본 크기는 서로 다른 실험에서의 경험적 평균이 실제 평균과 상당히 유사해야합니다. 결과는 코시 분포가 수렴 평균을 갖지 않지만 정규 분포는 있음을 보여줍니다.1 × 10 5
편집하다:
채팅에서 언급 한 @ mark999는 실험에 사용 된 두 분포가 비슷한 "분산"을 가지고 있다고 주장해야합니다. 인용 부호를 사용하는 이유는 Cauchy 분포 분산도 정의되어 있지 않기 때문입니다. 정당성은 다음과 같습니다. 그들의 PDF는 비슷합니다.
Cauchy 분포의 PDF를 살펴보면 추측 할 수 있지만 실험에서 볼 수는 없습니다. 이것이 데모의 요점입니다.
curve(dnorm, -8,8)
curve(dcauchy, -8,8)
Lebesgue-Stieltjes integral의 정의에 따르면 평균은 다음과 같은 경우에 존재합니다.
https://ko.wikipedia.org/wiki/Moment_(mathematics)#Significance_of_the_moments
코시 분포는 매우 근본적인 분포, 즉 원에 대한 균일 분포의 위장 된 형태입니다. 공식에서 무한 확률은 이며 여기서 는 각도 좌표입니다. 호 의 확률 (또는 측정 값) 은 입니다. 이것은 균일 분포 와는 다르지만 측정 값은 포함하지 않는 호에 대해서도 동일합니다 . 예를 들어, 반 시계 방향에서 까지의 원호에서 분포의 평균은. 그러나 길이가 인 두 개의 분리 된 간격의 해당 합집합 에 대한 균일 분포 의 평균 은 0입니다.
원의 분포는 회전 대칭이므로 원의 평균, 중간 또는 모드는있을 수 없습니다. 마찬가지로 분산과 같은 높은 모멘트는 의미가 없습니다. 이 분포는 많은 상황에서 자연스럽게 발생합니다. 예를 들어, 현재 진행중인 프로젝트에는 암 조직의 현미경 이미지가 포함됩니다. 이미지의 매우 많은 객체는 대칭이 아니며 "방향"을 각각에 할당 할 수 있습니다. 명백한 귀무 가설은 이러한 방향이 균일하게 분포되어 있다는 것입니다.
단순성을 감추려면 표준 단위 원으로하고 합니다. 우리는 정의 함수로서 에서 원 stereographical 투영하여 상 시킴으로써 행한다. 공식은 입니다. 미분하면 입니다. 따라서 무한한 확률은 Cauchy 분포의 일반적인 형태 인 이며, "Hey, presto!"는 단순성이 두통이되어 미묘한 치료가 필요합니다. 통합 이론.
에서는 우리의 부재 무시해 (즉 분석 재개 용의 이러한 평균 또는 고차 모멘트 같은 고려 때문에 확률) 의 (측정)는 0입니다. 그러므로 평균과 더 높은 순간이 존재하지 않으면 실제 선으로 넘어갑니다. 그러나 이제는 이라는 특수한 점이 있는데, 이는 입체 투영법 매핑되며 이는 Cauchy 분포의 중앙값과 모드가됩니다.