특정 유형의 반복 측정 데이터 중 가장 적절한 특성 분포를 찾으려고합니다.
본질적으로 지질학 분야에서는 종종 사건이 발생한 기간 (암석이 임계 온도 이하로 냉각 됨)을 찾기 위해 표본 (암석 덩어리)에서 광물의 방사성 연대 측정을 사용합니다. 일반적으로 각 샘플에서 여러 (3-10) 측정이 수행됩니다. 그리고, 평균 및 표준 편차 σ 가 취해진 다. 이것은 지질학이므로 상황에 따라 샘플의 냉각 시간을 10 5 에서 10 9 년으로 조정할 수 있습니다 .
그러나, 나는이 측정이 가우스 아니라는 것을 믿을 이유가 '이상 점'중 하나를 임의로 선언, 또는 피어스의 기준으로 몇 가지 기준을 통해 [로스, 2003] 또는 딕슨의 Q-테스트 [딘과 딕슨, 1951] , 상당히 있습니다 공통 (예 : 30 분의 1)이며 거의 항상 나이가 들기 때문에 이러한 측정 값이 특성 적으로 왜곡되어 있음을 나타냅니다. 이것이 광물 학적 불순물과 관련이있는 것으로 이해되는 이유가있다.
이 작업을 수행하는 가장 좋은 방법이 무엇인지 궁금합니다. 지금까지 약 600 개의 샘플이있는 데이터베이스와 샘플 당 2-10 개 정도의 복제 측정 값이 있습니다. 각 평균을 평균 또는 중앙값으로 나눈 다음 정규화 된 데이터의 히스토그램을 살펴보면서 샘플 정규화를 시도했습니다. 이것은 합리적인 결과를 산출하며 데이터가 특징적으로 로그-라플라시안이라는 것을 나타냅니다.
그러나 이것이 적절한 방법인지 확실하지 않은지 또는 내가 알지 못하는 경고가 내 결과를 바이어스하여 다음과 같이 보일 수 있는지 확실하지 않습니다. 누구든지 이런 종류의 경험이 있고 모범 사례를 알고 있습니까?