측정 불확실성을 포함하는 통계 테스트


11

y1과 y2라고하는 두 가지 질량 측정 그룹 (mg 단위)이 있다고 가정합니다. 두 가지 표본이 다른 평균을 가진 모집단에서 추출되었는지 확인하기 위해 테스트를하고 싶습니다. 예를 들어 (R에서) 이와 같은 것 :

y1 <- c(10.5,2.9,2.0,4.4,2.8,5.9,4.2,2.7,4.7,6.6)
y2 <- c(3.8,4.3,2.8,5.0,9.3,6.0,7.6,3.8,6.8,7.9)
t.test(y1,y2)

p- 값은 0.3234이며, 유의 수준 0.05에서는 두 그룹이 동일한 평균을 가진 모집단에서 도출되었다는 귀무 가설을 기각하지 않습니다. 이제 각 측정에 대해 불확실성이 주어졌습니다.

u1 <- c(2.3,1.7,1.7,1.7,2.0,2.2,2.1,1.7,2.3,2.2)
u2 <- c(2.4,1.8,1.6,2.3,2.5,1.8,1.9,1.5,2.3,2.3)

여기서 u1 [1]은 측정 y1 [1] (및 기타 등등)에서 결합 된 표준 불확실성입니다. 이러한 불확실성을 통계 테스트에 어떻게 통합합니까?


이 쌍 측정입니까? 불확실성은 추론을 향상시킬 수있는 가중치를 도출하는 데 사용될 수 있지만 불확실성의 변동은 매우 작기 때문에 불확실성이 정확하더라도 큰 이득은 없을 것입니다.
Glen_b-복귀 모니카

이들은 실제 페어링되지 않은 데이터의 하위 집합입니다. 이 예는 주로 질문을 명확하게하기위한 것입니다. 내가 실제로 찾고있는 것은 측정 불확실성을 가설 검정 (시험과 같은)에 가장 잘 통합하는 방법에 대한 일반적인 지침입니다. 측정 불확실성을 사용하지 않으면 많은 귀중한 정보를 낭비하고있는 것으로 보이지만 문헌에서이 주제에 대한 명확한 지침을 찾을 수 없었습니다.
Tom

그것들을 최대한 활용하려면 관측을 위해 확률 모델에 통합해야합니다. 측정 불확실성은 실제로 무엇을 나타내는가? (당신은 이것을 손으로 wave 수 없으므로 조심하십시오.)
Glen_b-복지국 모니카

답변:


1

가중 분석을 수행하려는 것 같습니다. SAS 문서의 "개념"섹션에 있는 "가중 통계 예" 를 참조하십시오 .


우리는 가중 평균과 가중 표준 편차로 t- 검정을 수행합니다. 여기서 u1과 u1은 가중치입니까?
Tom

예. i_th 관측치의 분산이 Var / w_i라고 가정합니다. 여기서 w_i는 i_th 관측치의 가중치이고 Var> 0입니다.
Rick

1

왜 시뮬레이션하지 않습니까? 즉, 각 관측치에 노이즈를 구현할 때 불확실성을 추가하십시오. 그런 다음 가설 검정을 반복하십시오. 이 작업을 1000 회 정도 수행하고 null이 거부 된 횟수를 확인하십시오. 노이즈에 대한 분포를 선택해야합니다. 법선은 하나의 옵션처럼 보이지만 부정적인 관찰을 생성 할 수 있으며 이는 현실적이지 않습니다.


1

회귀 문제로 바꾸고 불확실성을 가중치로 사용할 수 있습니다. 즉, 회귀 측정에서 그룹 (1 또는 2?)을 예측합니다.

그러나

불확실성은 거의 일정하므로이를 사용하면 아무런 변화가 없을 것 같습니다.

10.5의 경미한 특이 치는 평균 간의 차이를 줄여 문제를 복잡하게 만듭니다. 그러나 불확실성을 믿을 수 있다면 그 가치는 다른 어떤 것보다 더 의심되지 않습니다.

t- 검정은 다른 가설이 다른 모집단에서 두 표본을 추출한다는 가설이 있다는 것을 모릅니다. 알고있는 것은 특정 가정 하에서 수단을 비교하는 것입니다. 순위 기반 테스트는 대안이지만 이러한 데이터를 측정으로 관심이 있다면 목표에 적합하지 않은 것으로 보입니다.


요점을 알았어. 수단으로 표현하기 위해 질문을 변경했습니다.
Tom

0

일반적인 최소 제곱 (예 : lm (y ~ x))에서는 x 값이 주어지면 y 값 주위의 변동성 (불확실성)이 허용됩니다. 회귀를 뒤집 으면 (lm (x ~)) x 주위의 오차를 최소화 할 수 있습니다. 두 경우 모두 오류는 상당히 균일하다고 가정합니다.

반응 변수의 각 관측치에 대한 분산의 양을 알고 있고 x가 정렬 될 때 분산이 일정하지 않은 경우 가중 최소 제곱을 사용하려고합니다. 1 / (분산) 계수로 y 값에 가중치를 지정할 수 있습니다.

x와 y 모두에 불확실성이 있고 그 불확실성이 둘 사이에 동일하지 않다고 우려되는 경우 축 중 하나에 수직으로 잔차 (주소 불확실성)를 간단히 최소화하고 싶지 않습니다. 이상적인 추세선에 수직 인 불확실성을 최소화하는 것이 이상적입니다. 이렇게하려면, 당신은 PCA 회귀를 사용할 수있다 (도 있습니다. 직교 회귀, 또는 총 최소 제곱으로 알려진 PCA 회귀를위한 R 패키지 , 거기에있다 이전에 본 웹 사이트에이 주제에 대한 게시물하고 , 다음도 다른 곳에서 논의되었다 또한, 나는 당신이 여전히 분산에 대한 지식을 이용하여이 회귀의 가중 버전을 수행 할 수 있다고 생각합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.