Fisher의 LSD는 말 그대로 나쁜가요?


22

두 그룹에서 실험을 수행 할 때 (대개 표본 크기 (일반적으로 처리 그룹당 표본 크기는 약 7 ~ 8)) t- 검정을 사용하여 차이를 테스트합니다. 그러나 분산 분석을 수행 할 때 (분명히 두 개 이상의 그룹에 대해) Bonferroni (LSD / # 쌍별 비교) 또는 Tukey의 라인을 따라 무언가를 사후에 사용하고 학생으로서 경고를 받았습니다. Fisher의 LSD ( Least Significant Difference )를 사용합니다.

이제 LSD는 pairwise t-test와 비슷합니다. (내가 맞습니까?)이를 고려하지 않은 유일한 것은 우리가 여러 비교를하고 있다는 것입니다. ANOVA 자체가 중요한 경우 6 개 그룹을 처리 할 때 얼마나 중요합니까?

즉, Fisher의 LSD를 사용하는 과학적 / 통계적 이유가 있습니까?


1
' 그들 '이 누구인지 명확히 하고 그들이하는 말의 예를 포함시켜 주시겠습니까? (그들이 얼마나 나쁜 말을 하는가? 여기서 논의하고있는 것을 분명히하자.) 나는 LSD에 대한 비판과 일부는 정당화되었지만, 나는 당신이 무엇을 보았는지를 모른다. 또한 내가 본 것은 당신이 가지고있는 특징을 요구할 것입니다.
Glen_b-복지 주 모니카

당신이 Timothy Learys LSD에 대해 어떤 스택 교환 사이트 이야기를 알아 내려고 노력한다면 여기에 +1
PW Kad

@Glen_b 그들은 생명 의학의 과학자들을 가리 킵니다. 교수님의 말씀은 "Bonferroni 또는 Tukey를 사용하십시오. 절망에서만 LSD를 사용하십시오. 그래도 도움이되지 않으면 다른 LSD를 사용하십시오.")
Rover Eye

답변:


10

Fisher의 LSD는 실제로 쌍별 t- 검정입니다. 각 검정은 분산 분산 추정값으로 유의 한 분산 분석의 평균 제곱 오차를 사용하고 자연스럽게 관련 자유도를 취합니다. ANOVA가 중요하다는 것은이 테스트의 추가 제약입니다.

3 개 그룹의 특수한 경우에만 가족 별 오류율을 알파로 제한합니다. Howell은 그의 저서 인 행동 과학을위한 기초 통계, 제 8 판, David C. Howell의 16 장에서 그렇게하는 방법에 대해 매우 훌륭하고 비교적 간단한 설명을하고 있습니다 .

3 개 이상의 그룹은 @Alexis가 위에서 언급했듯이 알파가 빠르게 팽창합니다. 6 개 그룹에는 적합하지 않습니다. 나는 대부분의 사람들이 그것을 옵션으로 무시하도록 제안하는 것은이 제한된 적용 가능성이라고 생각합니다.


18

6 개 그룹을 다룰 때 다중 비교가 얼마나 중요합니까? 음 ... 여섯 개 그룹으로는 최대 다루고있는 가능한사후쌍 비교. 추정 할 수없는 랜달 먼로 (Randall Munroe)가 여러 비교의 중요성을 다루도록하겠습니다6(61)2=15

여기에 이미지 설명을 입력하십시오

그리고 난 당신의 오프닝 문장으로, 당신이 제안, 경우에 때때로 당신이 가지고 있다는 것을 추가 할 것이다 일곱 개 다음의 최대 번호, 그룹을 사후 페어 시험은 7(71)2=21


1
잘 만들었습니다. 그러나 이것이 우리에게 그룹이 거의없는 경우 (예 : 3 (3 쌍) 또는 4 (6 쌍)) 우연히 유의미한 값을 찾을 확률이 낮다는 것은 의문의 여지가 없습니다. (다시 말해서 LSD는 ANOVA의 중요성에 의해 보호됩니다)
Rover Eye

2
α

2
@Rover p> 0.05로 모두 통과하는 6 쌍의 테스트를 수행하면 p> 0.26을 의미합니다. 이는 상당히 중요한 변화입니다.
Voo

나는 실용적인 것을 요구하지 않고 단지 크게 소리 쳤다. 그러나 당신의 요점은 잘 만들어졌습니다. @Voo true, 오류가 증가하는 경향이 있습니다. 둘 다 고마워
Rover Eye

10

Fisher의 테스트는 모든 사람이 Neyman-Pearson의 관점에서 비롯된 것으로, 귀하의 질문이 의미하는 바를 수행하는 경우 (각각의 차이를 유의미한 ANOVA 테스트 후) 나쁘게 말합니다. 당신은 이것을 많은 출판 된 논문 에서 볼 수 있습니다 . 그러나 분산 분석 또는 그 이후의 모든 차이점을 테스트하는 것은 필요하거나 권장되지 않습니다. 그리고 Fisher의 검정은 통계적 추론에 대한 Neyman-Pearson 이론에 따라 만들어지지 않았습니다.

Fisher가 LSD를 제안 할 때 결과 차단의 중요성을 결정하기위한 중요하고 단단한 규칙을 고려하지 않았기 때문에 여러 테스트를 중요한 문제로 간주하지 않았다는 점을 명심해야합니다. 중요한 결과가있을 수 있지만 의미있는 내용의 중재자가 아닌 위치에 대한 데이터를 쉽게 이해할 수있는 방법으로 LSD를 구성 할 수 있습니다. p > 0.05 이면 더 많은 피사체를 실행해야한다고 Fisher가 말했음을 기억하십시오 .

왜 모든 것을 테스트하는 것이 좋은 생각이라고 생각하십니까? 왜 ANOVA를 실행하는지 고려하십시오. 당신은 아마 당신이 당신의 질문에 친밀한 것처럼 여러 t- 테스트를 실행하는 것이 문제가 있기 때문이라고 아마 배웠습니다. 그렇다면 왜 그 후에 또는 그와 동등한 것을 실행합니까? 나는 그것이 일어난다는 것을 알고 있지만 아직 ANOVA 후 테스트를 실행할 필요가 없습니다. 분산 분석 (ANOVA)은 데이터 패턴이 동일한 값 세트가 아니며 그 안에 의미가있을 수 있음을 알려줍니다. 많은 사람들이 테스트에서 의미있는 비트가 어디에 있는지 알려주지 않지만 데이터와 이론이 그 사실을 잊어 버린다는 경고에 매달립니다.


서류 감사합니다. ANOVA 후 사람들이 사후에 왜 사용하는지에 대한 의문을 제기합니다. 당신에게 솔직한 진실을 말하기 위해, 나는 정말로 모른다. ANOVA는 블랍 테스트라고 들었습니다. 앞에서 언급했듯이, 그 중요성이 어디에 있는지 알아 내야했습니다. 솔직히 말해서, 당신은 어떻게 ANOVA를보고하는지 알고 싶습니다.
Rover Eye

1
데이터 패턴을 알려 주면 분산 분석을보고하는 방법을 알려 드리겠습니다. 짧은 버전은 데이터를 설명하는 것입니다. 서로 매우 근접한 항목은 설명에서 그룹화되며 의미있는 차이로 간주되는 항목은 멀리 떨어져 있습니다 (그러나 모두 상대적입니다). A = 20, B = 58, C = 61, p = 0.03 이라고 가정 해 봅시다 . 나는 통계를보고하고 A가 B와 C보다 낮다. 따라서 그것은 모두 데이터에 달려 있습니다. 나는 일련의 항목들이 약간 비열한 방식으로 약간 번거 롭다고 생각할 수 있지만 (A = 10, B = 20, C = 30) 아마도 회귀를 수행했을 것입니다.
John

그것은 분산 분석을보고하는 매우 흥미로운 방법이며, 당신이 무엇을 얻고 있는지 볼 수 있습니다. 감독자와이 문제를 반드시 논의 할 수는 있지만 사후없이 분산 분석을보고하는 "규범"을 위반할 것인지는 확실하지 않습니다. 이 방법을 사용하여보고 된 과학 출판물을 찾으려고합니다.
Rover Eye

2
데이터에 의미가 있습니다. 그것이 무엇인지 분명합니다. 명백한 사실을 보여주기 위해 사후 조치를 취하면 ANOVA가 무엇을 먼저 수행하는지 모른다는 것을 알 수 있습니다.
John

6

Fisher의 LSD에 대한 추론은 N = 3 이상의 경우로 확장 될 수 있습니다 .

네 그룹의 경우에 대해 자세히 설명하겠습니다. 패밀리별로 제 1 종 오류율을 0.05 이하로 유지하려면, 4 개의 그룹간에 6 개의 사후 비교가 있지만 다중 비교 보정 계수 3 (즉, 비교 당 알파 0.05 / 3)이면 충분합니다. 이 때문입니다:

  • 4 개의 실제 평균이 모두 같은 경우 4 개의 그룹에 걸친 옴니버스 Anova는 가족 별 오류율을 0.05로 제한합니다.
  • 실제 평균 중 세 가지가 같고 네 번째가 서로 다른 경우 Type-I 오류를 일으킬 수있는 비교는 세 가지뿐입니다.
  • 실제 평균 중 두 개가 같고 다른 두 개와 같고 서로 다른 경우, 잠재적으로 제 1 종 오류를 생성 할 수있는 두 개의 비교 만 있습니다.

이것은 가능성을 소진시킵니다. 모든 경우에, 참 평균이 동일한 그룹에 대해 0.05 미만의 하나 이상의 p- 값을 찾을 확률은 다중 비교에 대한 보정 계수가 3 인 경우 0.05 이하로 유지되며 이는 가족 별 오류율의 정의입니다.

4 개 그룹에 대한이 추론은 Fisher의 3 개 그룹의 가장 중요한 차이 방법에 대한 설명에서 일반화 한 것입니다. 들면 N의 옴니버스 분산 분석 테스트가 중요한 경우 그룹, 보정 계수 (인 N -1) ( N -2) / 2. 따라서 N ( N -1) / 2 의 계수에 의한 Bonferroni 보정 이 너무 강합니다. N = 3에 대해 1의 알파 보정 계수를 사용하면 충분합니다 (이로 인해 Fisher의 LSD가 N = 3에 대해 작동하는 이유 ), N = 4에 대해 3 의 계수, N = 5에 대해 6 의 계수, 10에 대한 계수 N = 6 등.


+1. 이것은 스레드에 아주 좋은 추가입니다. 사이트에 오신 것을 환영합니다!
amoeba는 Reinstate Monica가

설명한 모든 상황에서 사후 테스트가 필요하지 않습니다.
John

1
(1)(2)/2
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.