측정 오류를 기준으로 우선 순위 선택


9

계측기의 측정 오류가있는 경우 적절한 사전 계산 방법은 무엇입니까? 이 단락은 Cressie의 저서 "시공간 데이터 통계"에서 발췌 한 것입니다.

측정 오류 분산과 관련하여 일부 사전 정보가 제공되어 상당히 유익한 매개 변수 모델을 지정할 수있는 경우가 종종 있습니다. 우리는 조건부 독립 측정 오차를 가정하는 경우, 예를 들어, IID되는 , 우리는에 대한 정보를 사전 지정한다 . 대기 온도에 관심이 있고 계측기 제조업체의 사양에 의“오류”가 표시되는 것을 보았습니다 . 이 "오류"가 2 개의 표준 편차 (확인해야하는 가정)에 해당한다고 가정하면 \ sigma _ {\ epsilon} ^ {2} 를 지정하여 사전 평균이 (0.1 / 2) ^ 2 = 0.0025가되도록 할 수 있습니다Gau(0,σϵ2)σϵ2±0.1°Cσϵ2(0.1/2)2=0.0025. 계측기 제조업체의 사양으로 인해 0.0025에서 명확하게 정의되고 상당히 좁은 피크 (예 : 역 감마)를 갖는 분포를 가정합니다. 사실, 우리는 0.0025로 고칠 수있었습니다. 그러나 데이터 모델 오류는 불확실성의 다른 요소들도 가질 수있다 (7.1 절). 프로세스 모델 오류로 식별 가능성 문제를 피하려면 모델러가 데이터를 복제하도록 설계된 부수적 연구를 포함하여 과학이 허용하는 한 불확실성을 줄이는 것이 매우 중요합니다.

위에서 설명한 것처럼 이전의 가치를 얻는 일반적인 절차가 무엇인지 아는 사람이 있습니까 (단, 사전 평균을 얻는 것만 언급하지만)?

답변:


6

두 가지 표준 방법

  1. 견적서에 표시된대로 "계측기 제조업체의 사양"을 참조하십시오 . (a) "정확도"및 "정확도"로 계측기 제조업체가 실제로 의미하는 것은 종종 불확실하고 (b) 새로운 정보가있을 때 계측기가 어떻게 반응했는지에 따라 다른 정보를 사용할 수 없을 때 일반적으로 사용되는 대체 결함입니다. 테스트 랩은 현장에서 사용될 때 수행하는 것보다 훨씬 나을 것입니다.

  2. 복제 샘플을 수집하십시오. 환경 샘플링에는 표본이 정기적으로 복제되는 (약 복제 할 수있는 더 많은 수준) 약 6 가지 수준이 있으며 각 수준은 할당 가능한 변형 소스를 제어하는 ​​데 사용됩니다. 이러한 출처는 다음과 같습니다.

    • 표본을 채취 한 사람의 신원.
    • 샘플을 얻기 전에 베일 링 웰과 같은 예비 절차를 수행합니다.
    • 물리적 샘플링 프로세스의 다양성.
    • 시료량 자체 내 이질성.
    • 시료를 보존하고 실험실로 배송 할 때 발생할 수있는 변경
    • 물리적 시료의 균질화 또는 분석을 위해 소화와 같은 예비 실험실 절차의 변형.
    • 실험실 분석가의 식별.
    • 실험실의 차이점.
    • 두 개의 가스 크로마토 그래프와 같이 물리적으로 구별되는 기기의 차이점.
    • 시간이 지남에 따라 계측기 교정에서 표류합니다.
    • 일주 변동. (이것은 자연스럽고 체계적 일 수 있지만 샘플링 시간이 임의 인 경우 무작위로 나타날 수 있습니다.)

가변성 성분의 완전한 정량적 평가는 적절한 실험 설계에 따라 이들 각 인자를 체계적으로 변화시킴으로써 만 얻을 수있다.

일반적으로 가장 변동성이 큰 것으로 알려진 소스 만 연구합니다. 예를 들어, 많은 연구에서 샘플을 얻은 후 특정 부분을 체계적으로 분리하여 두 개의 다른 실험실로 배송합니다. 이러한 분할 결과 간의 차이에 대한 연구는 측정 변동성에 대한 기여도를 정량화 할 수 있습니다. 그러한 분할이 충분히 얻어지면, 측정 변동성의 전체 분포는 계층 적 베이지안 시공간 모델에서 이전으로 추정 될 수있다. 가우시안 분포 (각 계산에 대해)를 가정하는 많은 모델이 있기 때문에, 가우시안을 구하는 것은 결국 분할 간의 차이의 평균 및 분산을 추정하는 것입니다. 둘 이상의 분산 성분을 식별하는 것을 목표로하는보다 복잡한 연구에서

이러한 문제에 대해 생각하는 것의 이점 중 하나는 이러한 오류 구성 요소를 수량화하지 않고도 일부 오류를 줄이거 나 제거 할 수있는 방법을 식별하여 Cressie & Wikle의 "불확실성 감소"라는 이상에 가까워진다는 것입니다 "과학이 허락하는 한."

확장 된 작업 예 (토양 샘플링)는 다음을 참조하십시오.

Van Ee, Blume 및 Starks, 토양 샘플링의 오류 평가에 대한 근거. 1990 년 5 월 미국 EPA : EPA / 600 / 4-90 / 013.


2
Robert의 문제는 때때로 누군가가 추정치에 대한 표준 편차를보고한다는 것입니다. 다른 경우에는 두 번 나눈 두 번 또는 두 번 신뢰 구간을보고합니다. 때로는 다른 것조차도; 따라서 정확성 및 정밀도 진술을 이전의 것으로 변환하는 명확한 규칙은 없습니다 . 숫자가 나타내는 것을 정확하게 파악하려면 각주 및 기타 기술 세부 사항을 참조 해야합니다 . 사용 된 표본 크기의 함수 인 추정치의 표준 오차는이 목적 BTW와 관련이 없습니다.
whuber

1
알았다. 두 번째 경우로 초점을 변경하겠습니다. 실험을 두 번 반복하고 및 측정 값을 얻는 경우이 정보를 사용하여 이전 분포의 평균 및 분산을 알 수있는 방법은 무엇입니까? 여러 분할에 대해 와 같은 것을 제안 했습니까? 따라서 측정 오류 및 샘플 표준 편차 평균이 있습니다. 이전 에 포함하기에 충분 합니까? m1m2m1m2mϵσϵN(mϵ,σϵ2)
Robert Smith

1
분할로 정확도를 평가할 수는 없습니다.이를 위해서는 알려진 값의 샘플을 측정해야합니다. (실험실 스파이크스파이크 복제본 이이를 위해 사용됩니다.) 이것이 평균을 결정합니다. 일반적으로 이것은 측정 프로세스를 교정 할 때 처리되므로 평균은 0이됩니다. 분산은 일반적인 ANOVA 공식으로 추정됩니다. 이를 사용하여 측정 시스템의 해당 구성 요소에 대한 사전을 지정할 수 있습니다.
whuber

2
그렇지 않다 : 내가 준 참고 문헌은 미국 EPA 지침으로, 25 년 동안 지속되어 왔으며 아이디어에 대한 최신 지침이 많이 포함되어있다. 한 번은 연방 법원 사건에서이 접근 방식을 사용하여 오염 된 깃털을 묘사하기 위해 그려진 지형선에 대한 측정 오류의 영향을 평가했습니다 (지리적 예측 변수를 기반으로). 측정 오류는 깃털을 묶는 데 사용 된 농도보다 큽니다! (즉, 깃털 묘사의 불확실성은 본질적으로 무한했습니다.)
whuber

1
정말 좋아요 그건 그렇고, 나는 사전에 일반적으로 많은주의를 기울이지 않고 설정된다고 말하고 싶었습니다. 나는 베이지안 모델링과 머신 러닝에서 이것을 눈에 띄게 보았습니다. 추측은 종종 적절한 결과를 산출하기에 충분하기 때문일 것입니다.
Robert Smith
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.