실험 데이터가 두꺼운 꼬리 분포를 따르는 지 어떻게 확인할 수 있습니까?


9

서버 응답 지연에 대한 몇 가지 테스트 결과가 있습니다. 우리의 이론 분석에 따르면, 지연 분포 (응답 지연의 확률 분포 함수)는 헤비 테일 동작을 가져야합니다. 그러나 테스트 결과가 두꺼운 꼬리 분포를 따른다는 것을 어떻게 증명할 수 있습니까?

답변:


12

귀하의 질문을 올바르게 해석하고 있는지 잘 모르겠으므로 알려주십시오.이 답변을 수정하거나 삭제할 수 있습니다. 먼저, 우리는 데이터와 관련된 것을 증명 하지 않고 단지 어떤 것이 부당하지 않다는 것을 보여줍니다. 이는 여러 가지 방법으로 수행 될 수 있으며 그 중 하나는 통계 테스트를 통하는 것입니다. 그러나 제 생각에 사전에 지정된 이론적 분포가 있다면 가장 좋은 방법은 qq-plot 을 만드는 것 입니다. 대부분의 사람들은 qq-plots를 정규성 평가에만 사용하는 것으로 생각하지만, 지정할 수 있는 이론적 분포 에 대해 경험적 Quantile을 그릴 수 있습니다. R을 사용하면 자동차 패키지에는 qq.plot () 기능이 확장됩니다. 좋은 기능의 많은을; 내가 좋아하는 두 가지는 가우시안 이외의 다양한 이론적 분포를 지정할 수 있다는 것입니다 (예 :t 더 먼 꼬리 대안 위해 ) 95 % 신뢰 구간을 표시한다는 것입니다. 특정 이론적 분포를 가지고 있지만, 단지 꼬리가 정상에서 예상보다 무거워 있는지 확인하지 않으려면 QQ 플롯에서 볼 수 있지만, 때로는 인식하기 어려울 수 있습니다. 내가 좋아하는 한 가지 가능성은 커널 밀도 플롯 과 qq 플롯 을 만드는 것입니다 . 부팅하기 위해 정상적인 곡선을 오버레이 할 수 있습니다. 기본 R 코드는 plot(density(data))입니다. 숫자의 경우 첨도를 계산할 수 있습니다예상보다 높은지 확인하십시오. 나는 R의 첨도에 대한 통조림 함수를 알지 못합니다. 링크 된 페이지에 주어진 방정식을 사용하여 코드를 작성해야하지만 어렵지 않습니다.


5
+1 좋은 조언과 좋은 토론. 그러나 첨도는 습니까? 더 높은 의미가 아닙니까? 다음을 사용하여 실험 할 수 있습니다 library(moments); apply(matrix(1:5,5,1), 1, function(p) kurtosis((1:100)^p)): R : 오른쪽 꼬리가 더 높은 힘 아래에서 뻗어 짐에 따라 첨도가 어떻게 증가하는지 확인하십시오.
whuber

죄송합니다. @ whuber, 잡아 주셔서 감사합니다. 나는 대답을 편집했다.
gung-복직 모니카

2
우리는 사물을 증명하지 않습니다 ...] 우리는 단지 어떤 것이 부당하지 않다는 것을 보여줍니다. 인용문!
Simone

e1071의 패키지도 포함되어 kurtosis여기에 사용할 수있는 기능.
Keith Hughitt
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.