크기 1과 3의 두 샘플을 비교하기위한 통계 테스트가 있습니까?


19

생태학 프로젝트를 위해 저의 실험실 그룹은 같은 양의 연못 물을 포함하는 4 개의 탱크, 1 개의 수생 식물 (수생 식물)이없는 대조군 및 각각의 동일한 양의 1 개의 수처리 식물로 3 개의 처리에 식초를 첨가했습니다. 식초를 첨가하는 목적은 pH를 낮추는 것이 었습니다. elodea가있는 탱크는 정상 pH로 더 빨리 돌아갈 것이라는 가설이있었습니다. 이것은 사실이었습니다. 약 2 주 동안 매일 각 탱크의 pH를 측정했습니다. 모든 탱크는 결국 자연적인 pH로 돌아 왔지만, 이것이 소요되는 시간은 elodea가있는 탱크의 경우 훨씬 짧았습니다.

우리는 교수님의 실험 설계에 대해 말했을 때, 대조군과 치료를 비교하기 위해 데이터에 대해 수행 할 수있는 통계 테스트는 없다고 말했습니다. 제어에 대한 복제가 없었기 때문에 (우리는 하나의 제어 탱크 만 사용 했음) 분산을 계산할 수 없으므로 제어와 처리의 표본 평균을 비교할 수 없습니다. 제 질문은 이것이 사실입니까? 나는 그가 의미하는 바를 분명히 이해한다. 예를 들어, 한 남자와 한 여자의 키를 가졌다면 각각의 인구에 대한 결론을 내릴 수 없습니다. 그러나 우리는 3 번의 치료를했고 그 차이는 적었습니다. 분산이 대조에서 유사하다고 가정하는 것이 합리적입니까?

최신 정보:

훌륭한 답변에 감사드립니다. 우리는 습지에서 더 많은 물과 elodea를 얻었고 우리는 더 작은 탱크로 실험을 다시 실행하기로 결정했지만 이번에는 5 개의 컨트롤과 5 개의 처리로 실험을 진행하기로 결정했습니다. 우리는 이것을 원래의 데이터와 결합하려고했지만, 탱크의 시작 pH는 원래 실험과 동일한 모집단에서 새로운 실험을 샘플링하는 것으로 간주하기에는 충분히 달랐습니다.

우리는 다른 양의 elodea를 추가하고 pH 수정 속도 (pH가 원래 값으로 돌아올 때까지 경과 한 시간으로 측정)와 elodea의 양을 연관 시키려고 노력했지만 필요하지 않다고 결정했습니다. 우리의 목표는 elodea가 양의 elodea에 정확히 어떻게 반응하는지에 대한 어떤 종류의 예측 모델을 구성하는 것이 아니라 elodea가 긍정적 인 차이를 만든다는 것을 보여주는 것입니다. 최적의 elodea 양을 결정하는 것은 흥미로울 것입니다. 그러나 그것은 아마도 생존 할 수있는 최대 양일 것입니다. 회귀 곡선을 데이터에 맞추려고 시도하면 많은 양을 추가 할 때 커뮤니티에 발생하는 다양한 복잡한 변경으로 인해 특히 밝아지지 않습니다. elodea는 죽고, 분해되고, 새로운 유기체가 지배하기 시작합니다.


4
3 개의 '처리'탱크 각각에 동일한 양의 Elodea를 추가 했습니까?
gung-Monica Monica 복원

2
예, 각 치료에 동일한 양의 Elodea를 추가했습니다.
Simon Hunt

답변:


21

gung의 질문에 주목하십시오. 그것은 중요. 처리 그룹의 모든 탱크에 대해 처리가 동일하다고 가정합니다.

두 그룹에 대해 분산이 같다고 주장 할 수있는 경우 (어쨌든 일반적으로 두 표본 t- 검정에 대해 가정) 검정을 수행 할 수 있습니다. 아무리 잘못 위반하더라도 그 가정을 확인할 수는 없습니다 .

관련 질문에 대한 답변에 표현 된 우려 사항은 상황과 훨씬 관련이 있지만 할 수있는 일은 더 적습니다.

[분산이 동일하다고 가정하는 것이 합리적인지 묻습니다. 우리는 당신을 위해 대답 할 수 없습니다. 그것은 당신이 주제 전문가 (예를 들어, 생태 학자)가 합리적인 가정이라고 설득해야 할 것입니다. 치료와 관리 모두에서 이러한 수준을 측정 한 다른 연구가 있습니까? 비슷한 테스트 ( 특히 t-tests 또는 anova- 더 나은 선례를 찾을 수 있음)가 수행되었거나 비슷한 가정이있는 다른 곳? 적용 할 수있는 일반적인 추론의 형태?]

경우 처리 및 샘플의 평균이다 제어의 평균이며, 모두 편차와 정규 분포로부터있다 다음 는 중 하나 가 1 인지 여부에 관계없이 평균 및 분산 .엑스¯와이¯σ2엑스¯와이¯μ엑스μ와이σ2(1/엑스+1/와이)

따라서 가 1이면와이

(엑스¯와이¯)에스엑스1/엑스+1

(여기서 는 처리에서 계산 된 표준 편차)는 null 아래에 분포됩니다 ( 자유도).에스엑스엑스1

당신의 최선의 추정치와 것을 알 수 있습니다 , 에 사용 이 정확히로 보통 두 개의 표본 t-test를 공식처럼 1로 설정합니다.σ에스엑스에스와이

편집하다:

다음은이 테스트에 대한 시뮬레이션 된 전력 곡선입니다. 널 (null)의 표본 크기는 10000이고 다른 점은 1000입니다. 보시다시피, 널 (null)의 거부율은 0.05이며, 검정력 곡선은 인구 집단에 큰 차이가 필요한 반면 적절한 검정력을 갖습니다. 올바른 모양. 즉,이 테스트는 예상대로 수행됩니다.

파워 커브

(종료 편집)

그러나 표본 크기가 너무 작 으면 분포 가정에 다소 민감합니다.

다른 가정을 할 준비가되었거나 다른 모집단 수량의 동등성을 테스트하려는 경우 일부 테스트가 여전히 가능할 수 있습니다.

따라서 모든 것이 손실되지는 않지만 가능한 경우 두 그룹 모두에서 복제를하는 것이 좋습니다.


1
@Glen_b에 나와있는 공식을 따라야합니다. Excel과 Minitab은 모두 이것을 계산하지 않습니다.
zbicyclist

10
(+1) (동일한 공식을 사용하는) 동등한 접근 방식-따라서이 답변을 정당화하기위한 더 많은 탄약 은 치료 그룹에서 하나의 미래 가치에 대한 예측 간격 을 계산할 수 있다는 것 입니다. 제어 값이 해당 예측 간격 내에 속하지 않으면 두 그룹 간의 차이에 대한 중요한 증거가 있습니다. 차이는 평균 차이 또는 분산 차이의 조합 일 수 있지만 차이가있을 수 있습니다 .
whuber

3
σ(엑스¯12)에스엑스1/엑스

2
@Glen_b : 지난 11 월에 이것이 변경되었는지 확실하지 않지만 R 3.0은 표본 크기 중 하나가 1 일 때 풀링 된 t- 검정을 수행하고 anova와 동일한 대답을 제공합니다.
Monica

2
R에서 시도하고 싶은 사람 t.test(x=c(4.5,4.8,4.6),y=5.2, var.equal=TRUE) 은 R2.15.2와 R3.0.0 (유일한 두 가지 버전)에서 모두 작동하는 것처럼 보입니다.
Glen_b-복지 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.