어떤 분포의 평균이 정의되지 않은 이유는 무엇입니까?


21

많은 PDF는 마이너스에서 양의 무한대까지 다양하지만 일부 수단은 정의되어 있지만 일부는 정의되지 않았습니다. 어떤 공통적 인 특성으로 계산할 수 있습니까?


14
수렴 적분.
Sycorax는 Reinstate Monica

1
이 분포는 수학적 추상화입니다. 적분이 수렴하지 않으면 평균이 정의되지 않습니다. 그러나 아래 답변에서 언급되지 않은 것은 마이너스 무한대에서 무한대까지의 PDF는 실제 데이터 소스를 모델링 할 수 없다는 것입니다. 실제로 이러한 데이터를 생성하는 물리적 프로세스는 없습니다. 제 생각에는 모든 실제 데이터 소스가 제한되며 평균을 근사화 할 수 있습니다.
Cagdas Ozgenc

3
@Cagdas 그 말이 정확하지 않은 것 같습니다. 두꺼운 꼬리가 많은 프로세스가 있습니다. 그들의 다양한 기대는 장기 평균의 극단적 인 변동으로 나타납니다. 예를 들어 Cauchy 모델을 설득력있게 적용하려면 Douglas Zare의 stats.stackexchange.com/a/36037/919 게시물을 참조하십시오 .
whuber

2
@CagdasOzgenc : Taleb의 Black Swan을 읽어야 그 추론이 얼마나 잘못되었는지 알 수 있습니다. 휴리스틱하게 정의되지 않은 평균 또는 무한 평균을 가진 분포를 완벽하게 생성하는 프로세스는 없을 수 있지만, 사람들은 꼬리가 얼마나 뚱뚱한지를 과소 평가하고 평균을 계산하는 과정에 대한 많은 예가 있지만, 실제 분포에는 그것은 완전히 다르며 일반적으로 오른쪽으로 치우친 것을 의미합니다. 이런 종류의 부적절한 추론은 금융에서 위험이 많은 수준으로 과소 평가되는 많은 위험 평가 간격으로 이어졌습니다.
Alex R.

1
@Cagdas Ozgenc : 논증이 왜 틀린지 논의하려면 stats.stackexchange.com/questions/94402/…를
kjetil b halvorsen

답변:


23

분포의 평균은 적분의 관점에서 정의됩니다 (즉, Riemann의 적분과 같이 연속 분포의 경우와 같이 작성하지만 문제가 더 일반적으로 적용됩니다 .Stieltjes 또는 Lebesgue 통합으로 진행할 수 있습니다. 이것들을 올바르게 그리고 한 번에 모두) :

이자형(엑스)=엑스에프(엑스)엑스

그러나 그것은 무엇을 의미합니까? 효과적으로 속기입니다

에이,에이엑스에프(엑스)엑스

또는

에이에이0엑스에프(엑스)엑스+0엑스에프(엑스)엑스

(0이 아닌 어디에서나 깨뜨릴 수 있지만)

이러한 적분의 한계가 유한하지 않은 경우 문제가 발생합니다.

예를 들어, 비례하는 표준 Cauchy 밀도를 고려 하십시오.11+엑스2

0엑스1+엑스2엑스

하자 그래서 d u = 2 x=1+엑스2=2엑스엑스

=1211+21

=12ln()|11+2

=12ln(1+2)

유한하지 않습니다. 하반기의 한계도 유한하지 않습니다. 따라서 기대치는 정의되지 않습니다.

또는 임의 변수로 표준 Cauchy의 절대 값을 가졌다면 전체 기대 값은 방금 살펴본 한도에 비례합니다 (예 : ).12ln(1+2)

다른 한편으로, 일부 다른 밀도는 "무한대까지"계속되지만 그 적분에는 한계가 있습니다.


1
(물론) 비슷한 이산 확률 분포에서도 같은 것을 볼 수 있습니다. 정수 대해 발생할 확률 이 비례 하는 분포를 취하십시오 . 확률의 합은 유한하다 (한계 1이 필요하기 때문에 마찬가지로, 실제로 상수는 또는 그 이상 이어야 함 ). 그러나 은 의미가 없습니다. 비례하는 확률을 선택하는 경우 평균에는 의 합이 포함 되며 우리는 괜찮습니다. "충분히 작아서"수렴합니다. n > 0 1>0 612 16π2 11 1112
스티브 제섭

1
예, 는 이에 대한 스케일링 상수입니다 (1로 합산). 6π2
Glen_b-복지 주 모니카

8

다른 답변은 좋지만 모든 사람, 특히 Cauchy 분포 ( )를 한 사람이 평균 0 이어야 한다는 것은 직관적으로 분명하다고 말하지 않을 수 있습니다.엑스0=0

수학적 관점에서 직관적 인 답변이 정확하지 않은 이유는 Riemann 재 배열 정리 (비디오) 때문 입니다.

Cauchy를보고 평균 "제로"를 말할 때 실제로하고있는 일은 "중심"을 0으로 분할 한 다음 두 크기의 균형을 잡는 것입니다. 다시 말해서, 당신은 암시 적으로 긍정적 인 용어 "반쪽"(각 오른쪽 점의 순간)과 음의 용어 "반쪽"(왼쪽의 순간)으로 무한한 합계를하고 있다고 주장합니다. 0으로 합산합니다. (기술적으로 생각하면 )0에프(엑스0+아르 자형)아르 자형아르 자형0에프(엑스0아르 자형)아르 자형아르 자형=0

Riemann 재배치 정리에 따르면 이러한 유형의 무한 합 (양수와 음수를 모두 갖는 하나)은 두 계열 (양수 항만 및 음수 항만)이 독립적으로 취해질 때 각각 수렴하는 경우에만 일관성이 있다고합니다. 양변 (양수와 음수)이 서로 다른 경우, 당신은 어떤 수로 합계되도록 항의 합산 순서를 생각해 낼 수 있습니다. (위의 비디오, 6:50부터 시작)

따라서 0에서 균형 잡힌 방식으로 합산을 수행하면 Cauchy 분포의 첫 번째 순간이 취소됩니다. 그러나 평균의 (표준) 정의는이 합산 순서를 강제하지 않습니다. 모멘트를 임의의 순서로 합산 할 수 있어야하며 동일하게 유효해야합니다. 따라서 Cauchy 분포의 평균은 정의되어 있지 않습니다. 순간을 합산하는 방법을 신중하게 선택하면 사실상 어느 시점에서나 "균형"(또는 불균형)으로 만들 수 있습니다.

따라서 분포의 평균을 정의하려면 두 모멘트 적분이 각각 제안 된 평균 주위에 독립적으로 수렴 (유한)해야합니다 (수학을 할 때 실제로는 완전 적분 ( 수렴되어야합니다). 꼬리가 한 쪽의 모멘트를 무한정으로 만들기에 충분한 "뚱뚱한"상태라면 끝입니다. 반대편에서는 무한한 순간과 균형을 맞출 수 없습니다.에프(엑스)엑스엑스


나는 Cauchy 분포와 같은 것들의 "카운터 직관적"행동은 전적으로 무한대에 대해 생각할 때 문제로 인한 것이라고 언급해야합니다. Cauchy 분포를 취하고 xkcd 수의 플러스 / 마이너스와 같이 임의로 먼 거리까지 꼬리를 잘라 내고 (정규화 한 후에는) 갑자기 동작하고 정의 된 평균을 갖는 무언가를 얻습니다. 문제는 뚱뚱한 꼬리 자체가 아니라 무한대에 접근 할 때 꼬리가 어떻게 행동하는지입니다.


좋은. 예를 들어, 두 가지로 이어지는 "합계 순서"를 제공 할 수 있는지 궁금합니다.
Matthew Drury

@MatthewDrury : p_i 및 n_i는 양수와 음수를 나타냅니다. [n_i, p_i]에 대한 적분이 2+ (1 / i)이고 [n_ {i + 1}, p_i]에 대한 적분이 2- (1 / i)가되도록 p_i 및 n_i를 연속적으로 찾습니다. R, matlab 또는 mathematica를 사용하여 명시 적으로 수행 할 수 있지만 한정된 수의 용어에 대해서만 가능합니다.
David Epstein

7

Abrial 장군과 Glen_b는 완벽한 답을 얻었습니다. Cauchy 분포가 존재하지 않거나 수렴하지 않는 평균을 보여주기 위해 작은 데모를 추가하고 싶습니다.

다음 실험에서는 큰 표본을 얻어 표본으로부터 경험적 평균을 계산하더라도 수치는 실험마다 상당히 다릅니다.

set.seed(0)
par(mfrow=c(1,2))
experiments=rep(1e5,100)
mean_list_cauchy=sapply(experiments, function(n) mean(rcauchy(n)))
mean_list_normal=sapply(experiments, function(n) mean(rnorm(n)))
plot(mean_list_cauchy,ylim=c(-10,10))
plot(mean_list_normal,ylim=c(-10,10))

여기에 이미지 설명을 입력하십시오

우리는 실험을하고 각 실험 에서 두 분포에서 점을 샘플링합니다. 이러한 표본 크기는 서로 다른 실험에서의 경험적 평균이 실제 평균과 상당히 유사해야합니다. 결과는 코시 분포가 수렴 평균을 갖지 않지만 정규 분포는 있음을 보여줍니다.1 × 10 51001×105

편집하다:

채팅에서 언급 한 @ mark999는 실험에 사용 된 두 분포가 비슷한 "분산"을 가지고 있다고 주장해야합니다. 인용 부호를 사용하는 이유는 Cauchy 분포 분산도 정의되어 있지 않기 때문입니다. 정당성은 다음과 같습니다. 그들의 PDF는 비슷합니다.

Cauchy 분포의 PDF를 살펴보면 추측 할 수 있지만 실험에서 볼 수는 없습니다. 이것이 데모의 요점입니다.0

curve(dnorm, -8,8)
curve(dcauchy, -8,8)

여기에 이미지 설명을 입력하십시오


4
나는 이것이 Cauchy 분포가 의미가 없음을 보여주지 않는다고 생각합니다. Cauchy 분포를 적절히 큰 분산을 갖는 정규 분포로 바꾸면 비슷한 결과를 얻을 수 있습니다.
mark999

좋은 지적 @ mark999, 나는이 문제를 해결하기 위해 답변을 편집 할 것입니다.
Haitao Du

Cauchy 배포판의 PDF에서 뚱뚱한 꼬리를 보면서 의미가 없다는 것을 알아낼 수 있습니까?
ks1322

아마도 당신은 이것을 염두에두고 있었습니까? stats.stackexchange.com/questions/90531/…
Sycorax는 Monica Reinstate Monica가


2

코시 분포는 매우 근본적인 분포, 즉 원에 대한 균일 분포의 위장 된 형태입니다. 공식에서 무한 확률은 이며 여기서 는 각도 좌표입니다. 호 의 확률 (또는 측정 값) 은 입니다. 이것은 균일 분포 와는 다르지만 측정 값은 포함하지 않는 호에 대해서도 동일합니다 . 예를 들어, 반 시계 방향에서 까지의 원호에서 분포의 평균은θ/2πθ에이에스1이자형h(에이)/2π(π,π)ππεπ+ε (=π+ε모드2π)π. 그러나 길이가 인 두 개의 분리 된 간격의 해당 합집합 에 대한 균일 분포 의 평균 은 0입니다.(π,π)ε/2π

원의 분포는 회전 대칭이므로 원의 평균, 중간 또는 모드는있을 수 없습니다. 마찬가지로 분산과 같은 높은 모멘트는 의미가 없습니다. 이 분포는 많은 상황에서 자연스럽게 발생합니다. 예를 들어, 현재 진행중인 프로젝트에는 암 조직의 현미경 이미지가 포함됩니다. 이미지의 매우 많은 객체는 대칭이 아니며 "방향"을 각각에 할당 할 수 있습니다. 명백한 귀무 가설은 이러한 방향이 균일하게 분포되어 있다는 것입니다.

단순성을 감추려면 표준 단위 원으로하고 합니다. 우리는 정의 함수로서 에서 원 stereographical 투영하여 상 시킴으로써 행한다. 공식은 입니다. 미분하면 입니다. 따라서 무한한 확률은 Cauchy 분포의 일반적인 형태 인 이며, "Hey, presto!"는 단순성이 두통이되어 미묘한 치료가 필요합니다. 통합 이론.에스1=(0,1)에스1엑스θ엑스엑스=탠 껍질(θ/2)θ/2=엑스/(1+엑스2)θπ(1+엑스2)

에서는 우리의 부재 무시해 (즉 분석 재개 용의 이러한 평균 또는 고차 모멘트 같은 고려 때문에 확률) 의 (측정)는 0입니다. 그러므로 평균과 더 높은 순간이 존재하지 않으면 실제 선으로 넘어갑니다. 그러나 이제는 이라는 특수한 점이 있는데, 이는 입체 투영법 매핑되며 이는 Cauchy 분포의 중앙값과 모드가됩니다.에스1{}에스1=(0,1)0아르 자형


2
코시 분포에는 중앙값과 모드가 있습니다.
jkabrg

아주 그렇습니다. 나는 조금 쫓겨났다. 그러나 평균이 존재하지 않는다는 주장은 맞습니다. 나는 대답을 편집 할 것입니다.
David Epstein

왜 "원에 하나가 없기 때문에 의미가있을 수 없습니까?" 당신의 주장에는 많은 것이 빠져 있습니다. "원에서"균일 한 분포라는 의미는 및 이지만 이므로 말씀하신 내용을 이해할 수 없습니다. θ(π,π)엑스=탠 껍질(θ/2)이자형[θ]=0
jkabrg

@jkabrg : 새로운 수정 사항이 더 이해하기 쉽기를 바랍니다.
David Epstein
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.