사이트의 많은 게시물이 Cauchy의 다양한 속성을 다루었지만 실제로 함께 배치 한 게시물을 찾지 못했습니다. 잘하면 이것은 일부를 수집하기에 좋은 장소 일 수 있습니다. 이것을 확장 할 수 있습니다.
두꺼운 꼬리
코시 (Cauchy)는 대칭적이고 대략 종 모양이지만, 정규 분포와 다소 비슷하지만 꼬리가 훨씬 무겁고 "어깨"가 적습니다. 예를 들어, Cauchy 랜덤 변수가 중앙값으로부터 1000 개 이상의 사 분위수 범위에 놓일 가능성은 작지만 뚜렷한 확률이 있습니다. 정규 랜덤 변수는 중앙값에서 최소 2.67 개의 사 분위수 범위와 거의 같습니다.
변화
코시의 분산은 무한합니다.
편집 : JG는 주석에서 정의되지 않았다고 말합니다. 분산을 값 쌍 사이의 제곱 거리의 절반으로 평균으로 계산하면 둘 다 존재하는 경우 분산과 동일하며 무한대입니다. 그러나 일반적인 정의에 따르면 JG는 정확합니다. 그럼에도 불구하고 n이 커질 때 실제로 수렴하지 않는 샘플 수단과 대조적으로 샘플 크기의 분포는 샘플 크기가 증가함에 따라 계속 커집니다. 스케일은 n에 비례하여 증가하거나, 로그 분산의 분포는 표본 크기에 따라 선형으로 증가합니다. 무한을 산출하는 분산의 버전이 실제로 우리에게 무언가를 말하고있는 것을 고려하는 것이 생산적으로 보인다.]
물론 표본 표준 편차가 존재하지만 표본이 클수록 표본이 커지는 경향이 있습니다 (예 : n = 10에서 중간 표본 표준 편차는 척도 모수 (IQR의 절반)의 3.67 배 근처에 있지만 n =에 있습니다) 100은 약 11.9입니다).
평균
코시 분포는 유한 한 평균도 없습니다. 평균의 적분은 수렴되지 않습니다. 결과적으로 많은 수의 법칙도 적용되지 않습니다. n이 커짐에 따라 표본 평균은 일정량으로 수렴되지 않습니다 (실제로 수렴 할 수있는 것은 없습니다).
실제로 Cauchy 분포의 표본 평균 분포는 단일 관측치 (!)의 분포와 동일합니다. 꼬리는 너무 무겁기 때문에 합계에 더 많은 값을 추가하면 평균을 취할 때 더 큰 분모로 나눌 수있는 정도로 극단적 인 값이 될 가능성이 높습니다.
예측 가능성
Cauchy 분포에서 관측 한 결과에 대해 완벽하게 합리적인 예측 구간을 생성 할 수 있습니다. 위치 및 스케일을 추정하는 데 잘 수행되는 간단하고 상당히 효율적인 추정기가 있으며 대략적인 예측 간격을 구성 할 수 있으므로 적어도 Cauchy 변수는 '예측 가능'합니다. 그러나 꼬리가 매우 먼 거리를 차지하므로 높은 확률 간격을 원할 경우 꼬리가 상당히 넓을 수 있습니다.
분포의 중심을 예측하려는 경우 (예 : 회귀 유형 모델), 이는 어떤 의미에서는 비교적 예측 하기 가 쉽습니다 . Cauchy는 상당히 정점에 도달하므로 (일반적인 척도 측정을 위해 중심에 "배분 된"분포가 많음) 적절한 추정값이있는 경우 중심을 비교적 잘 추정 할 수 있습니다.
예를 들면 다음과 같습니다.
표준 Cauchy 오류 (100 개의 관측치, 절편 = 3, 기울기 = 1.5)와 선형 관계에서 데이터를 생성하고 y 특이 값에 합리적으로 강력한 세 가지 방법으로 회귀선을 추정했습니다. Tukey 3 group line (red), Theil regression (진한 녹색) 및 L1- 회귀 (파란색). Cauchy에서는 그 어느 것도 특히 효율적이지는 않지만보다 효율적인 접근을 위해서는 훌륭한 출발점이 될 것입니다.
그럼에도 불구하고이 3 개는 데이터의 노이즈에 비해 거의 일치하며 데이터가 실행되는 중심에 매우 가깝습니다. 그런 의미에서 코시는 분명히 "예측 가능"하다.
절대 잔차의 중앙값은 임의의 선에 대해 1보다 약간 큽니다 (대부분의 데이터는 추정 된 선에 매우 가깝습니다). 그런 의미에서 코시는 "예측 가능"하다.
왼쪽 그림에는 큰 특이 치가 있습니다. 데이터를 더 잘 보려면 오른쪽에서 y 축의 스케일을 좁혔습니다.