분포 밀도 함수에서 아래 그래프와 같이 Cauchy 분포의 평균 (= 0)을 식별 할 수 있습니다. 그러나 왜 우리는 코시 분포가 의미가 없다고 말합니까?
분포 밀도 함수에서 아래 그래프와 같이 Cauchy 분포의 평균 (= 0)을 식별 할 수 있습니다. 그러나 왜 우리는 코시 분포가 의미가 없다고 말합니까?
답변:
예상 값이 존재하지 않는지 기계적으로 확인할 수 있지만 적어도 Huygens의 원칙 과 큰 법칙을 받아들이는 경우 물리적으로 직관적이어야합니다 . 큰 수의 법칙의 결론은 Cauchy 분포에서는 실패하므로 평균을 가질 수 없습니다. 독립적 인 Cauchy 랜덤 변수의 평균을 구하면 결과는 확률 과 함께 로 으로 수렴되지 않습니다 . 같은 크기의 코시 분포를 유지합니다. 이것은 광학에서 중요합니다.0 n → ∞ 1
코시 분포는 점 소스의 선에서 정규화 된 빛의 강도입니다. Huygens의 원칙에 따르면 광원과 대상 사이의 모든 선에서 빛이 다시 방출된다고 가정하여 강도를 결정할 수 있습니다. 그래서, 한 라인 광의 강도 떨어져 빛이 첫 행 안타 가정하여 결정될 수 미터 떨어진 곳에 켜고, 임의의 각도로 전방으로 다시 방출된다. 광고에 대한 광의 강도 미터 거리로 표현 될 수 행에서의 광 분포 -fold 컨벌루션 미터 떨어진 곳에 켜고. 즉, 합계 독립적 코시 분포의 인자에 의해 스케일링 코시 분포 .(1) N , N 1 , N , N
코시 분포는 평균이 있다면, 다음 의 백분위 나눈 -fold 컨볼 루션 수렴해야 할 것이다 많은 수의 법칙에 의해. 대신 일정하게 유지됩니다. 당신이 표시하면 A (투명) 라인 번째 백분위 수 미터 거리에, 등 미터 거리를, 다음이 지점에서 직선 형성 도. 그들은 쪽으로 구부리지 않습니다 .N , N 0 25 1 2 45 0
이것은 특히 Cauchy 분포에 대해 알려주지 만 명확한 물리적 해석이없는 다른 분포가 있기 때문에 적분 검정을 알아야합니다.
Michael Chernicks의 답변에 대한 @whuber의 의견에 대한 답변으로 추가되었습니다 (whuber가 지적한 오류를 제거하기 위해 완전히 다시 작성하십시오).
Cauchy 확률 변수의 예상 값에 대한 적분 값은 정의되지 않은 것으로 알려져 있습니다. 그 값은 원하는 것으로 "만들어 질"수 있기 때문입니다. 적분 (Riemann 적분 의미로 해석 됨)는 일반적으로 호출되는 것입니다 적분과 그 값은 제한값으로 계산되어야합니다 : 또는
Cauchy 프린시 펄 값은 단일 한계로 확보됩니다. 위의 이중 제한 대신 . 한계는 모든 대해 을 갖기 때문에 기대 적분의 주요 값은 쉽게 보입니다 . 그러나 이것은 Cauchy 랜덤 변수의 평균이 이라고 말하는 데 사용될 수 없습니다 . 즉, 평균은 주요한 의미가 아니라 일반적인 의미에서 적분의 값으로 정의됩니다.
들면 대신 일체 고려 의 한계 값에 도달하는 를 . 때 , 우리는 주요 값을 얻을 위의 논의를. 따라서 표현에 분명한 의미를 부여 할 수 없습니다
확률에 대한 측정 이론 이론적 접근법을 사용하고 있고 예상 값 적분이 Lebesgue 적분의 의미로 정의되면 문제는 더 간단합니다. 는 유한이기 때문에 코시 랜덤 변수 정의되지 이후 유한 아니다.
위의 답변은 왜 Cauchy 분포에 대한 기대치가 없는지에 대한 유효한 설명이지만, 두 개의 독립적 인 정규 변이 의 비율이 밝아지는 것처럼 Cauchy 라는 사실을 발견했습니다 . 한 두 번째 기대치는 입니다.
Cauchy는 선택한 지점 (0)이 평균이 아니므로 평균이 없습니다. 그것은이다 중앙값 과 모드 . 절대 연속 분포의 평균은 로 정의됩니다. 여기서 는 밀도 함수이고 적분은 의 도메인 ( Cauchy의 경우 에서 으로 가져옵니다. Cauchy 밀도의 경우이 적분은 유한하지 않습니다 ( 에서 까지의 절반 은 이고 에서 의 절반 은 ).f f − ∞ ∞ − ∞ 0 − ∞ 0 ∞ ∞
Cauchy 분포는 단위 원에 대한 균일 분포로 가장 잘 생각되므로 평균화가 의미가 있다면 놀라운 일입니다. 가 일종의 "평균화 함수" 라고 가정하십시오 . 즉, 단위 원의 각 유한 서브 세트 에 대해 가 단위 원의 점이라고 가정합니다. 분명히, 는 "자연스럽지 않아야"합니다. 보다 정확하게 는 회전에 대해 등변 할 수 없습니다. 보다 일반적이지만 덜 눈에 띄지 않는 형태로 코시 분포를 구하려면 (0,1)에서 단위 원을 x 축에 투영하고이 투영을 사용하여 원의 균일 분포를 x 축으로 옮깁니다.X f ( X ) f f
평균이 존재하지 않는 이유를 이해하려면 x를 단위 원의 함수로 생각하십시오. 단위 원에서 무한한 수의 분리 된 호를 찾는 것은 매우 쉽습니다. 따라서 호 중 하나의 길이가 d이면 그 호에서 x> 1 / 4d입니다. 따라서이 분리 된 각 호는 평균의 1/4 이상을 차지하며이 호의 총 기여는 무한합니다. 우리는 동일한 일을 다시 할 수 있지만 x <-1 / 4d, 총 기여 마이너스 무한대로. 이 간격은 다이어그램과 함께 표시 될 수 있지만 Cross Validated에 대한 다이어그램을 만들 수 있습니까?
일부 랜덤 변수 의 평균 또는 예상 값은 일부 확률 측정 대해 정의 된 Lebesgue 적분입니다 . P E X = ∫ X d P
Cauchy 랜덤 변수의 평균이 존재하지 않는다는 것은 Cauchy rv의 적분이 존재하지 않음을 의미합니다. Cauchy 분포의 꼬리는 두꺼운 꼬리 (정규 분포의 꼬리와 비교)이기 때문입니다. 그러나 예상 값이 존재하지 않아도 Cauchy 랜덤 변수의 다른 함수가 존재하는 것은 금지되지 않습니다.
시각적 인 설명이 더 있습니다. (수학에 어려움을 겪는 우리를 위해). 신중한 분산 난수 생성기를 사용하여 결과 값을 평균화하십시오. 이 기능에 대한 좋은 페이지가 있습니다. https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable 임의의 값의 "첨두 치"로 인해 작은 값 대신 작은 값으로 증가 할 수 있습니다. . 따라서 의미가 없습니다.
훌륭한 답변에 덧붙여서, 적분의 비 수렴이 통계 실습과 관련이있는 이유에 대해 몇 가지 논평을하겠습니다. 다른 사람들이 언급했듯이, 우리가 주요 가치를 "평균"으로 허용한다면, slln은 더 이상 유효하지 않습니다! 이 외에도 실제로 모든 모델이 근사치라는 사실의 의미에 대해 생각하십시오. 구체적으로, Cauchy 분포는 무한한 랜덤 변수에 대한 모형입니다. 실제로, 임의의 변수는 경계가 있지만, 경계는 종종 모호하고 불확실합니다. 제한되지 않은 모델을 사용하면 모델에 불확실한 (그리고 자연스럽지 않은) 경계가 불필요하게 도입됩니다. 그러나 이것이 이해 되려면 문제의 중요한 측면에 영향을 미치지 않아야합니다. 그것은 우리가 경계를 도입한다면 모델을 중요한 방식으로 변경해서는 안됩니다. 그러나 적분이 비 수렴 인 경우에는 발생하지 않습니다! RV의 기대치가 대부분 임의의 범위에 의존한다는 점에서 모델이 불안정합니다. (응용 프로그램에서 경계를 대칭으로 만들 이유가있을 필요는 없습니다!)
이런 이유로, 적분이 "무한"이라고 말하는 것보다 적분이 있다고 말하는 것이 낫습니다. 더 철저한 토론이 여기에 있습니다 .
나는 조금 까다 롭고 싶었다. 상단의 그래픽이 잘못되었습니다. x 축은 표준 편차에 있으며, 코시 분포에는 존재하지 않습니다. 직장에서 매일 매일 코시 배포판을 사용하기 때문에 까다 롭습니다. 혼란으로 인해 경험적 오류가 발생할 수있는 실제 사례가 있습니다. 자유도가 1 인 학생의 t- 분포는 표준 Cauchy입니다. 일반적으로 중요도에 필요한 다양한 시그마를 나열합니다. 이 시그마는 표준 편차가 아니며 가능한 오류이며 mu가 모드입니다.
위의 그래픽을 올바르게 수행하려면 x 축이 원시 데이터이거나 동등한 크기의 오류를 원할 경우 동일한 가능한 오류가 발생합니다. 가능한 분포 중 하나는 정규 분포에서 .67 표준 편차입니다. 두 경우 모두 반사 분위수 범위입니다.
이제 귀하의 질문에 대한 답변에 관해서는, 모든 사람들이 위에서 쓴 모든 것이 정확하며 이것이 수학적 이유입니다. 그러나 나는 당신이 학생이고 주제에 익숙하지 않다고 생각하므로 시각적으로 명백한 반 직관적 수학적 해결책은 사실이 아닐 수도 있습니다.
Cauchy 분포에서 추출한 거의 동일한 실제 샘플이 두 개 있으며 모두 동일한 모드와 동일한 오류가 있습니다. 하나의 평균은 1.27이고 다른 하나의 평균은 1.33입니다. 평균이 1.27 인 표준 편차는 400이고, 평균이 1.33 인 표준 편차는 5.15입니다. 두 가지 모두 가능한 오류는 .32이고 모드는 1입니다. 이는 대칭 데이터의 경우 평균이 중앙 50 %가 아님을 의미합니다. 모든 테스트에서 평균 및 / 또는 분산을 유의성 밖으로 밀어 내기 위해서는 한 번의 추가 관찰 만하면됩니다. 그 이유는 평균과 분산이 매개 변수가 아니며 표본 평균과 표본 분산 자체가 임의의 숫자이기 때문입니다.
가장 간단한 대답은 Cauchy 분포의 모수에 평균이 포함되지 않으므로 평균에 대한 분산이 없다는 것입니다.
과거 교육학에서 평균의 중요성은 보통 충분한 통계량이라는 것이 었습니다. 장기 빈도 기반 통계에서 Cauchy 분포에는 충분한 통계가 없습니다. 전체 실수를 지원하는 Cauchy 분포에 대한 표본 중앙값이 충분한 통계량 인 것은 사실이지만, 이는 주문 통계량에서 상속하기 때문입니다. 그것은 우연히 충분하지만 그것에 대해 생각하기 쉬운 방법이 없습니다. 이제 베이지안 통계에는 Cauchy 분포의 모수에 대한 통계가 충분하며 이전에 균일을 사용하면 편향되지 않습니다. 매일 사용해야한다면 추정을 수행하는 모든 방법에 대해 배웠기 때문에이 문제를 제기했습니다.
잘린 Cauchy 분포에 대한 추정값으로 사용할 수있는 유효한 순서 통계가 없습니다. 실제 분포에서 발생할 가능성이 높기 때문에 대부분의 실제 응용 프로그램에 대한 빈도 기반 분석법에는 충분한 통계가 없습니다. .
내가 제안하는 것은 정신적으로 의미에서 벗어나 실제 무언가라는 것입니다. 망치와 같은 도구로 광범위하게 유용하며 일반적으로 사용할 수 있습니다. 때로는 해당 도구가 작동하지 않을 수 있습니다.
정규 분포와 Cauchy 분포에 대한 수학적 메모. 데이터가 시계열로 수신되면 정규 분포는 t가 무한대로 갈 때 오류가 0으로 수렴 할 때만 발생합니다. 데이터가 시계열로 수신되면 오류가 무한대로 분기 될 때 Cauchy 분포가 발생합니다. 하나는 수렴 계열 때문이고 다른 하나는 분기 계열 때문입니다. Cauchy 분포는 한도에서 특정 지점에 도달하지 않으며 고정 된 지점을 앞뒤로 흔들어 한 쪽 시간의 50 %와 다른 쪽 시간의 50 %가되도록합니다. 중앙값 복귀가 없습니다.