코시 분포가 의미가없는 이유는 무엇입니까?


109

분포 밀도 함수에서 아래 그래프와 같이 Cauchy 분포의 평균 (= 0)을 식별 할 수 있습니다. 그러나 왜 우리는 코시 분포가 의미가 없다고 말합니까?

여기에 이미지 설명을 입력하십시오


2
참조 Cabeza G., UA를 추천합니다. (2013). La Media de la Distribución de Cauchy. Cauchy 분포의 평균에 대한 블로그 Apoyo en Matemáticas에서 .

내 대답은 여기에 있습니다 : stats.stackexchange.com/questions/94402/…
kjetil b halvorsen

답변:


99

예상 값이 존재하지 않는지 기계적으로 확인할 수 있지만 적어도 Huygens의 원칙큰 법칙을 받아들이는 경우 물리적으로 직관적이어야합니다 . 큰 수의 법칙의 결론은 Cauchy 분포에서는 실패하므로 평균을 가질 수 없습니다. 독립적 인 Cauchy 랜덤 변수의 평균을 구하면 결과는 확률 과 함께 로 으로 수렴되지 않습니다 . 같은 크기의 코시 분포를 유지합니다. 이것은 광학에서 중요합니다.0 n 1n0n1

코시 분포는 점 소스의 선에서 정규화 된 빛의 강도입니다. Huygens의 원칙에 따르면 광원과 대상 사이의 모든 선에서 빛이 다시 방출된다고 가정하여 강도를 결정할 수 있습니다. 그래서, 한 라인 광의 강도 떨어져 빛이 첫 행 안타 가정하여 결정될 수 미터 떨어진 곳에 켜고, 임의의 각도로 전방으로 다시 방출된다. 광고에 대한 광의 강도 미터 거리로 표현 될 수 행에서의 광 분포 -fold 컨벌루션 미터 떨어진 곳에 켜고. 즉, 합계 독립적 코시 분포의 인자에 의해 스케일링 코시 분포 .(1) N , N 1 , N , N21nn1nn

코시 분포는 평균이 있다면, 다음 의 백분위 나눈 -fold 컨볼 루션 수렴해야 할 것이다 많은 수의 법칙에 의해. 대신 일정하게 유지됩니다. 당신이 표시하면 A (투명) 라인 번째 백분위 수 미터 거리에, 등 미터 거리를, 다음이 지점에서 직선 형성 도. 그들은 쪽으로 구부리지 않습니다 .N , N 0 25 1 2 45 025nn02512450

이것은 특히 Cauchy 분포에 대해 알려주지 만 명확한 물리적 해석이없는 다른 분포가 있기 때문에 적분 검정을 알아야합니다.


39
+1 지금 조명 응답 :-) (죄송합니다)입니다. 그건 그렇고, 원칙은 Huygen이 아닌 Christiaan Huygens의 이름을 따서 명명되었습니다. Huygens는 파스칼 (Pascal)에 의해 1650 년대에 출판 된 확률로 새로운 발전에 대해 처음으로 감사 한 바있다 (Fermat와 그의 편지를 기반으로 함) : 그것은 예상에 대한 Huygens의 설명 (1657)이며 원래 수학에 대한 확률 이론을 얻었다. Jakob Bernoulli ( Ars Conjectandi , 1713) 의 중요한 (사후) 논문을위한 발판을 마련했다 .
whuber

4
강도가 아닌 진폭이 전파됩니다.
Doru Constantin

2
이것은 훌륭한 해답이지만 혼란스러운 결론을 얻습니다. "... 25 번째 백분위 수를 45도 직선으로 표시하십시오. 0을 향해 구부러지지 않습니다." 이 진술 자체는 사실이지만 (Huygens-Fresnel 원칙의 결과) " 으로 나눈"이전 입니다. 2 미터에서 2로, 3 미터에서 3으로 나누면 ..., 투명 선은 수직입니다 (빛을 포착하는 화면에 수직). 45도 Quantile 라인은 Cauchy의 합에 속하며 인수 (아직)에 도움이되지 않습니다. n
Lee David Chung Lin

40

Michael Chernicks의 답변에 대한 @whuber의 의견에 대한 답변으로 추가되었습니다 (whuber가 지적한 오류를 제거하기 위해 완전히 다시 작성하십시오).

Cauchy 확률 변수의 예상 값에 대한 적분 값은 정의되지 않은 것으로 알려져 있습니다. 그 값은 원하는 것으로 "만들어 질"수 있기 때문입니다. 적분 (Riemann 적분 의미로 해석 됨)는 일반적으로 호출되는 것입니다 적분과 그 값은 제한값으로 계산되어야합니다 : 또는

xπ(1+x2)dx
x
xπ(1+x2)dx=limT1limT2+T1T2xπ(1+x2)dx
xπ(1+x2)dx=limT2+limT1T1T2xπ(1+x2)dx
물론 두 평가 모두 동일한 유한 값을 제공해야합니다. 그렇지 않은 경우 적분은 정의되지 않은 것으로 간주됩니다. 이것은 Cauchy 랜덤 변수의 평균이 정의되지 않은 이유를 즉시 보여줍니다. 내부 한계의 한계 값이 다양합니다.

Cauchy 프린시 펄 값은 단일 한계로 확보됩니다. 위의 이중 제한 대신 . 한계는 모든 대해 을 갖기 때문에 기대 적분의 주요 값은 쉽게 보입니다 . 그러나 이것은 Cauchy 랜덤 변수의 평균이 이라고 말하는 데 사용될 수 없습니다 . 즉, 평균은 주요한 의미가 아니라 일반적인 의미에서 적분의 값으로 정의됩니다.

limTTTxπ(1+x2)dx
00T0

들면 대신 일체 고려 의 한계 값에 도달하는 를 . 때 , 우리는 주요 값을 얻을 위의 논의를. 따라서 표현에 분명한 의미를 부여 할 수 없습니다α>0

TαTxπ(1+x2)dx=TTxπ(1+x2)dx+TαTxπ(1+x2)dx=0+ln(1+x2)2π|TαT=12πln(1+α2T21+T2)=12πln(α2+T21+T2)
ln(α)πTα=10
xπ(1+x2)dx
두 개의 무한대에 접근하는 방법을 지정하지 않고이 점을 무시하면 모두 주된 가치의 우유가 가치의 크림으로 가장 할 때 일이 항상 보이는 것은 아니기 때문에 일종의 합병증과 잘못된 결과. 이것이 Cauchy 랜덤 변수의 평균 이 적분의 주요 값인 갖기보다는 정의되지 않은 이유 입니다.0

확률에 대한 측정 이론 이론적 접근법을 사용하고 있고 예상 값 적분이 Lebesgue 적분의 의미로 정의되면 문제는 더 간단합니다. 는 유한이기 때문에 코시 랜덤 변수 정의되지 이후 유한 아니다.g|g|E[X]XE[|X|]


9
중간 적분의 평가가 잘못되었습니다. 로그가 아니라 0입니다. 문제는 실제로 무한 적분에 내재 된 두 한계를 평가하는 데 있습니다.
whuber

@whuber 오류를 지적 해 주셔서 감사합니다. 답변을 완전히 다시 작성했으며 귀하의 의견이 더 이상 적용되지 않습니다.
Dilip Sarwate

비율에 대한 기대가 존재하지 않는 이유를 이해하지 못합니다. 경우 및 공동 통상 0보다 평균 다른 배포되어, 다음의 평균 주어진다 , 내가 무엇을 놓치고 있습니까? XYZ=XYxyp(x,y)dxdy
Royi

@Drazick 나는 내 대답의 어느 곳에서나 두 개의 임의 확률 변수의 비율을 언급하지 않았습니다. Cauchy 임의 변수와 관련하여이 문제를 제기 한 사람에게 문의하십시오.
Dilip Sarwate

2
@Drazick 적분 이 존재 하는지 살펴보십시오 . 일반적으로 의 밀도가 부근에서 연속적인 경우 E [X ^ {-1}] $는 존재하지 않습니다. X0
Dilip Sarwate

33

위의 답변은 왜 Cauchy 분포에 대한 기대치가 없는지에 대한 유효한 설명이지만, 두 개의 독립적 인 정규 변이 의 비율이 밝아지는 것처럼 Cauchy 라는 사실을 발견했습니다 . 한 두 번째 기대치는 입니다.X1/X2N(0,1)

E[|X1||X2|]=E[|X1|]×E[1|X2|]
+

1
되어 이 표준 Cauchy 라는 것을 알고있을 때 '접힌'Cauchy 랜덤 변수 ? 의 분포를 찾는 방법 ? |X1X2|X1X2|X1X2|
StubbornAtom

1
예, 이것은 Cauchy 변수의 절대 값이므로 양의 실수에 대한 밀도 를 갖습니다 . f(x)+f(x)
시안

정규 분포를 접 으면무한하지 않습니까? E1/|X2|
Albert Chen

무한대입니다.
시안

22

Cauchy는 선택한 지점 (0)이 평균이 아니므로 평균이 없습니다. 그것은이다 중앙값모드 . 절대 연속 분포의 평균은 로 정의됩니다. 여기서 는 밀도 함수이고 적분은 의 도메인 ( Cauchy의 경우 에서 으로 가져옵니다. Cauchy 밀도의 경우이 적분은 유한하지 않습니다 ( 에서 까지의 절반 은 이고 에서 의 절반 은 ).f f 0 0 xf(x)dxff00


9
나는 당신을 비판하지 않습니다, @Dilip : 나는 당신의 관찰을 강화하고 있습니다. 매우 흥미로운 것은 0의 주요 값이 존재하면 Cauchy 분포의 평균 (또는 RV의 평균)을 적분의 주요 값으로 정의하도록 유혹 할 수 있다는 것입니다. 이것은이 질문의 본질에 대해 훨씬 더 깊이 탐구합니다. 이것은 적분이 무한하거나 정의 되지 않았다고 선언함으로써 강조됩니다. 즉, 주요 가치가 왜 효과가 없습니까? 그것을 평균으로 사용하는 것이 합법적이지 않은 이유는 무엇입니까?
whuber

5
@whuber 또한 a> 0에서 -a와 + a에서 적분을 자르면 0을 얻는다는 것도 흥미 롭습니다. 따라서 대칭 적분의 ∞에 접근 할 때 한계를 취하면 0이됩니다. 0은 평균입니다.
Michael Chernick

10
@ whuber : 나는 당신의 두 번째 말에서 당신의 마지막 질문을 수사적이라고 생각합니다; 어쨌든 우리는 절대 수렴을 원하고 마음 속에 "이유"가있는 것은 사물이 영역처럼 행동하기를 원하기 때문입니다. 특히, 우리는 사물 (기능)을 여러 조각으로 자르고 우리가 얻는 답을 방해하지 않으면 서 마음대로 그것들을 재 배열 할 수 있어야합니다. 우리는 Cauchy 분포를 갖는 선형 함수에 대해 이러한 도마와 재배치를 수행 할 수 없으므로 그 평균이 존재하지 않아야한다고 주장해야합니다.
추기경

9
@cardinal은 좋은 대답입니다! 나는 질문 자체가 "왜 우리는 코시 분포가 의미가 없다고 말합니까?"라는 질문을하기 때문에 단순히 수사적이지 않았습니다. 기대가 정의되지 않았다고 주장하는 것은 어리석은 일을 만족시킬 수 있지만, 적분에 대한 합리적인 대안 적 정의가 존재할 수 있으며 직관적으로 올바른 대답을 얻을 수 있습니다! 당신의 대답은 내가 생각했던 것에 가깝지만 여전히 불완전합니다. 조건부 수렴 적분으로 작업 할 때 실패하는 통계 이론의 중요한 이론을 만족스럽게 대답 할 것이라고 생각합니다.
whuber

7
@ Dilip 나도 그렇게 생각했지만, 반영시 이것이 당신이 제안하는 것보다 조금 더 도전적이라는 것을 발견하십시오. 예를 들어, 중앙 한계 정리에는 문제가 없습니다. 분산을 요구하면 물론 자동으로 기대를 보장합니다. 그리고 많은 이론들이 체비 쇼프의 불평등을 사용하여 입증되었습니다. 여기서 우리는 평균을 보장합니다. 그래서 저는 정말로 궁금합니다. 조건부 수렴 (convergent)이 아닌 수렴 (convergent)이 아닌 기대에 대한 문제를 실제로 인식해야하는 통계 관행에 사용되는 큰 정리는 무엇입니까?
whuber

16

Cauchy 분포는 단위 원에 대한 균일 분포로 가장 잘 생각되므로 평균화가 의미가 있다면 놀라운 일입니다. 가 일종의 "평균화 함수" 라고 가정하십시오 . 즉, 단위 원의 각 유한 서브 세트 에 대해 가 단위 원의 점이라고 가정합니다. 분명히, 는 "자연스럽지 않아야"합니다. 보다 정확하게 는 회전에 대해 등변 할 수 없습니다. 보다 일반적이지만 덜 눈에 띄지 않는 형태로 코시 분포를 구하려면 (0,1)에서 단위 원을 x 축에 투영하고이 투영을 사용하여 원의 균일 분포를 x 축으로 옮깁니다.X f ( X ) f ffXf(X)ff

평균이 존재하지 않는 이유를 이해하려면 x를 단위 원의 함수로 생각하십시오. 단위 원에서 무한한 수의 분리 된 호를 찾는 것은 매우 쉽습니다. 따라서 호 중 하나의 길이가 d이면 그 호에서 x> 1 / 4d입니다. 따라서이 분리 된 각 호는 평균의 1/4 이상을 차지하며이 호의 총 기여는 무한합니다. 우리는 동일한 일을 다시 할 수 있지만 x <-1 / 4d, 총 기여 마이너스 무한대로. 이 간격은 다이어그램과 함께 표시 될 수 있지만 Cross Validated에 대한 다이어그램을 만들 수 있습니까?


1
@DavidEpstein 사이트에 오신 것을 환영합니다. 답변 필드 위의 작은 그림 아이콘 (마법사 실행)을 클릭하여 원하는 소프트웨어로 이미지를 만들고 답변에 업로드 할 수 있습니다. 그러나 불행히도 그렇게하려면> = 10 담당자가 필요합니다. 나는 당신이 곧 그것을 가질 것이라고 확신합니다. 그 사이에 인터넷의 다른 곳에 이미지를 게시하고 답변에 링크를 게시 할 수 있으면 더 높은 담당자가 이미지를 가져 와서 게시 할 수 있습니다.
gung

3
나는 Cauchy가 원에서 유니폼으로 해석되는 것을 알지 못했지만 확실히 의미가 있습니다. 위상 학적 논증은 평균화 함수의 특성을 가진 원에 연속 함수가있을 수 없음을 보여줍니다.
johnny

@DavidEpstein 나는 다른 게시물에서 귀하의 답변을 읽었 습니다 . 입체 투영은 정말 좋습니다. 이에 반해, 반원의 똑같이 유효한 방사상 투영이 왜 평균이 잘 정의되어 있지 않음을 언급 할 수 있습니까? 즉, 이면 는 표준 Cauchy입니다. 기하학적으로 이것은 내각이 항상 해당 중심각의 절반이라는 기본 사실입니다. UUnif[0,1]Xtan(π(U12))
Lee David Chung Lin

실제로 Huygens의 원리가 왜 입체 투영을 제공하는지 명확하지 않기 때문에 광원의 물리적 모델 측면에서 반원 그림이 더 적합합니다.
이 데이비드 정 린

10

일부 랜덤 변수 의 평균 또는 예상 값은 일부 확률 측정 대해 정의 된 Lebesgue 적분입니다 . P E X = X d PXP

EX=XdP

Cauchy 랜덤 변수의 평균이 존재하지 않는다는 것은 Cauchy rv의 적분이 존재하지 않음을 의미합니다. Cauchy 분포의 꼬리는 두꺼운 꼬리 (정규 분포의 꼬리와 비교)이기 때문입니다. 그러나 예상 값이 존재하지 않아도 Cauchy 랜덤 변수의 다른 함수가 존재하는 것은 금지되지 않습니다.


5
꼬리는 적분이 수렴하게하기 위해 어느 방향으로도 충분히 빨리 붕괴되지 않는다는 의미에서 "무거운"것입니다. 이 개념은 정규 분포 (또는 모든 기준 분포)와 아무 관련이 없습니다.
whuber

4
예,이 수정에 감사드립니다. 나는 두꺼운 꼬리와 정규 분포 사이의 엄격한 연결을 의미하지는 않습니다. 그러나 정규 분포 (가벼운 꼬리 포함)와 두꺼운 꼬리 분포를 비교하면 시각적으로 "무거운"꼬리의 개념을 이해하기가 조금 더 쉽다고 생각합니다.
Tomas


4

훌륭한 답변에 덧붙여서, 적분의 비 수렴이 통계 실습과 관련이있는 이유에 대해 몇 가지 논평을하겠습니다. 다른 사람들이 언급했듯이, 우리가 주요 가치를 "평균"으로 허용한다면, slln은 더 이상 유효하지 않습니다! 이 외에도 실제로 모든 모델이 근사치라는 사실의 의미에 대해 생각하십시오. 구체적으로, Cauchy 분포는 무한한 랜덤 변수에 대한 모형입니다. 실제로, 임의의 변수는 경계가 있지만, 경계는 종종 모호하고 불확실합니다. 제한되지 않은 모델을 사용하면 모델에 불확실한 (그리고 자연스럽지 않은) 경계가 불필요하게 도입됩니다. 그러나 이것이 이해 되려면 문제의 중요한 측면에 영향을 미치지 않아야합니다. 그것은 우리가 경계를 도입한다면 모델을 중요한 방식으로 변경해서는 안됩니다. 그러나 적분이 비 수렴 인 경우에는 발생하지 않습니다! RV의 기대치가 대부분 임의의 범위에 의존한다는 점에서 모델이 불안정합니다. (응용 프로그램에서 경계를 대칭으로 만들 이유가있을 필요는 없습니다!)

이런 이유로, 적분이 "무한"이라고 말하는 것보다 적분이 있다고 말하는 것이 낫습니다. 더 철저한 토론이 여기에 있습니다 .


-4

나는 조금 까다 롭고 싶었다. 상단의 그래픽이 잘못되었습니다. x 축은 표준 편차에 있으며, 코시 분포에는 존재하지 않습니다. 직장에서 매일 매일 코시 배포판을 사용하기 때문에 까다 롭습니다. 혼란으로 인해 경험적 오류가 발생할 수있는 실제 사례가 있습니다. 자유도가 1 인 학생의 t- 분포는 표준 Cauchy입니다. 일반적으로 중요도에 필요한 다양한 시그마를 나열합니다. 이 시그마는 표준 편차가 아니며 가능한 오류이며 mu가 모드입니다.

위의 그래픽을 올바르게 수행하려면 x 축이 원시 데이터이거나 동등한 크기의 오류를 원할 경우 동일한 가능한 오류가 발생합니다. 가능한 분포 중 하나는 정규 분포에서 .67 표준 편차입니다. 두 경우 모두 반사 분위수 범위입니다.

이제 귀하의 질문에 대한 답변에 관해서는, 모든 사람들이 위에서 쓴 모든 것이 정확하며 이것이 수학적 이유입니다. 그러나 나는 당신이 학생이고 주제에 익숙하지 않다고 생각하므로 시각적으로 명백한 반 직관적 수학적 해결책은 사실이 아닐 수도 있습니다.

Cauchy 분포에서 추출한 거의 동일한 실제 샘플이 두 개 있으며 모두 동일한 모드와 동일한 오류가 있습니다. 하나의 평균은 1.27이고 다른 하나의 평균은 1.33입니다. 평균이 1.27 인 표준 편차는 400이고, 평균이 1.33 인 표준 편차는 5.15입니다. 두 가지 모두 가능한 오류는 .32이고 모드는 1입니다. 이는 대칭 데이터의 경우 평균이 중앙 50 %가 아님을 의미합니다. 모든 테스트에서 평균 및 / 또는 분산을 유의성 밖으로 밀어 내기 위해서는 한 번의 추가 관찰 만하면됩니다. 그 이유는 평균과 분산이 매개 변수가 아니며 표본 평균과 표본 분산 자체가 임의의 숫자이기 때문입니다.

가장 간단한 대답은 Cauchy 분포의 모수에 평균이 포함되지 않으므로 평균에 대한 분산이 없다는 것입니다.

과거 교육학에서 평균의 중요성은 보통 충분한 통계량이라는 것이 었습니다. 장기 빈도 기반 통계에서 Cauchy 분포에는 충분한 통계가 없습니다. 전체 실수를 지원하는 Cauchy 분포에 대한 표본 중앙값이 충분한 통계량 인 것은 사실이지만, 이는 주문 통계량에서 상속하기 때문입니다. 그것은 우연히 충분하지만 그것에 대해 생각하기 쉬운 방법이 없습니다. 이제 베이지안 통계에는 Cauchy 분포의 모수에 대한 통계가 충분하며 이전에 균일을 사용하면 편향되지 않습니다. 매일 사용해야한다면 추정을 수행하는 모든 방법에 대해 배웠기 때문에이 문제를 제기했습니다.

잘린 Cauchy 분포에 대한 추정값으로 사용할 수있는 유효한 순서 통계가 없습니다. 실제 분포에서 발생할 가능성이 높기 때문에 대부분의 실제 응용 프로그램에 대한 빈도 기반 분석법에는 충분한 통계가 없습니다. .

내가 제안하는 것은 정신적으로 의미에서 벗어나 실제 무언가라는 것입니다. 망치와 같은 도구로 광범위하게 유용하며 일반적으로 사용할 수 있습니다. 때로는 해당 도구가 작동하지 않을 수 있습니다.

정규 분포와 Cauchy 분포에 대한 수학적 메모. 데이터가 시계열로 수신되면 정규 분포는 t가 무한대로 갈 때 오류가 0으로 수렴 할 때만 발생합니다. 데이터가 시계열로 수신되면 오류가 무한대로 분기 될 때 Cauchy 분포가 발생합니다. 하나는 수렴 계열 때문이고 다른 하나는 분기 계열 때문입니다. Cauchy 분포는 한도에서 특정 지점에 도달하지 않으며 고정 된 지점을 앞뒤로 흔들어 한 쪽 시간의 50 %와 다른 쪽 시간의 50 %가되도록합니다. 중앙값 복귀가 없습니다.


9
이 응답에는 약간의 혼란이 있습니다! 예를 들어 "지금 베이지안 통계에는 Cauchy 분포의 모수에 대한 통계가 충분하며 이전에 유니폼을 사용하면 편향되지 않습니다."라고 표시됩니다. 이것을 이해하기가 어렵습니다! 우선, Frequentist와 Bayesian의 개념에 대한 개념은 매우 가깝습니다. (그리고 나는 특이하고 무한한 샘플 공간에서만 다를 수 있기 때문에 실제 라인은 동일합니다.) 고정 치수의 Cauchy 모델에 대한 통계는 충분하지 않습니다 (단순히 완전한 데이터이면 충분합니다).
kjetil b halvorsen

-6

간단히 말해, 축소 할 때 곡선 아래 영역이 무한대에 도달합니다. 유한 영역을 샘플링하면 해당 영역의 평균을 찾을 수 있습니다. 그러나 무한의 의미는 없습니다.


8
PDF 아래의 영역은 정의상 이므로 "곡선"으로 다른 의미를 가져야합니다. 무엇입니까? 1
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.