“무료 점심 정리”는 일반 통계 테스트에 적용됩니까?


12

내가 일하고 있던 한 여성이 일부 데이터에 대해 일원 분산 분석을 수행하도록 요청했습니다. 나는 데이터가 반복 측정 (시계열) 데이터이며 독립성에 대한 가정이 위반되었다고 생각했다. 그녀는 가정에 대해 걱정하지 말고 시험 만하면 가정이 충족되지 않았 음을 고려할 것이라고 대답했다.

그것은 나에게 옳지 않은 것처럼 보였다. 나는 몇 가지 조사를했고, 데이비드 로빈슨이 멋진 블로그 게시물을 발견, K-수단 클러스터링는 무료 점심 아닙니다 없음 무료 점심 정리에 나를 노출. 나는 원래의 논문을 보았고 일부는 물건을 따라 갔으며 솔직히 수학은 내 머리 위로 조금 있습니다.

데이비드 로빈슨 (David Robinson)에 따르면 통계 테스트의 힘은 가정에서 비롯된 것 같습니다. 그리고 그는 두 가지 훌륭한 예를 제시합니다. 다른 기사와 블로그 게시물을 살펴보면 항상지도 학습 또는 검색 측면에서 참조되는 것으로 보입니다.

내 질문은,이 정리는 일반적으로 통계 테스트에 적용됩니까? 다시 말해, t- 검정 또는 분산 분석의 힘은 가정의 준수에서 비롯된 것으로, 무료 점심 식사 정리를 인용 할 수 있습니까?

나는 전직 상사에게 내가 한 일에 관한 최종 문서를 빚지고 있으며, 당신이 통계 테스트의 가정을 무시하고 그것을 받아 들일 것이라고 말할 수있는 무료 점심 식사 정리를 참조 할 수 있는지 알고 싶습니다. 결과를 평가할 때 계정.


4
반복 측정 ANOVA를 "비밀로"하지 않는 이유는 무엇입니까?
Horst Grünbusch 2016 년

1
@ HorstGrünbusch 사실, 데이터와 테스트는 포럼에서 반복 측정 ANOVA에 대한 특정 질문과 함께 논의되었으며 선형 혼합 효과 모델이 최선의 선택 일 것입니다.
rwjones

2
이것은 이미 잘 답변되었으므로 더 많은 플립 팬트 응답을 추가 할 수 있습니다. 상사에게 가정에 위배되는 결과를 어떻게 고려할 것인지 정확하게 물어볼 수 있습니다 ( "주의하는 것"은 아무것도 아닌 것보다 낫습니다!). 요컨대, 가정에 대해 부주의하게 생각할 수있는시기를 알기에 충분한 이해와 경험을 얻는 것은 길고 어려운 길입니다. Rupert G. Miller의 Beyond ANOVA (뉴욕 : Wiley, 1986 년 이후 재 인쇄)는 결과에 대한 좋은 소스이며, 그 주요 주제는 독립성 가정을 무시하는 것이 가장 위험한 일 중 하나라는 것입니다.
Nick Cox

1
@NickCox 글쎄, 그녀는 더 이상 내 상사가 아니고이 특별한 상황이 주된 이유이다. 그것은 기본적으로 그렇지 않은 연구 환경에서 그녀를 대신하여 많은 조잡한 사고와 조잡한 프로젝트 관리의 정점이었습니다. 그 외에도, 책 추천에 감사드립니다. 그것의 소리에서, 그것은 내 최종 보고서에서 인용하고자하는 것 중 하나입니다.
rwjones

답변:


11

나는 증거를 모른다. 그러나 이것은 꽤 일반적으로 적용되는 것이 틀림 없다. 예를 들어 2 개의 치료군 각각에서 2 명의 대상체를 대상으로 한 실험이 있습니다. Wilcoxon 검정은 0.05 수준에서 유의미 할 수는 없지만 t- 검정은 가능합니다. 당신은 그것의 힘이 단지 데이터가 아니라 가정에서 반 이상이라고 말할 수 있습니다. 원래 문제에 대해 주제별 관측치가 독립적 인 것처럼 진행하는 것은 적절하지 않습니다. 사실 이후 사안을 고려하는 것은 매우 특별한 상황 (예 : 군집 샌드위치 추정기)을 제외하고는 통계적으로 좋은 습관이 아닙니다.


2

당신은 인용 할 수 없음 무료 점심 정리를 원하는 경우,하지만 당신은 단지 인용 수 더스 Ponens (또한으로 알려진 박리 법 의 루트입니다, 연역적 추리의 기준) 없음 무료 점심 정리를 .

없음 무료 점심 정리는 모든 목적에 맞게 수있는 알고리즘이 없습니다 사실 : 더 구체적인 아이디어를 포함한다. 다시 말해, 무료 점심 식사 정리 (No Free Lunch Theorem) 는 기본적으로 알고리즘 마법의 탄환 이 없다고 말합니다 . Modus Ponens의 근본 원인은 올바른 결과를 제공하는 알고리즘 또는 통계 테스트에서 선점을 만족시켜야하기 때문입니다.

모든 수학적 이론에서와 마찬가지로, 선례를 위반하면 통계 테스트는 의미가 없으며 단지 진실을 도출 할 수 없습니다. 따라서 테스트를 사용하여 데이터를 설명하려면 필요한 선점을 충족한다고 가정해야합니다. 그렇지 않은 경우 테스트가 잘못되었습니다.

그 때문에 과학적인 추론 공제에 기반 : 기본적으로, 테스트 / 법률 / 정리가입니다 의미 규칙 당신이 premisse이있는 경우 말한다, A다음 결론을 내릴 수는 B: A=>B하지만이없는 경우 A, 다음 중 하나를 가질 수 B또는 하지 B, 그리고 두 경우 모두에 해당합니다 즉 논리적 추론 / 공제합니다 (잠정 Ponens 규칙)의 기본 원칙 중 하나입니다. 다시 말해, 선례를 위반하면 결과는 중요하지 않으며 아무것도 추론 할 수 없습니다 .

이진 의미의 표를 기억하십시오.

A   B   A=>B
F   F    T
F   T    T
T   F    F
T   T    T

따라서 귀하의 경우 단순화하기 위해 Dependent_Variables => ANOVA_correct. 이제 독립 변수를 사용하여 Dependent_Variablesis False인 경우 Dependent_Variables가정이 위반 되므로 의미가 적용됩니다 .

물론 이것은 간단하지만 실제로는 분산 변수 사이에 항상 어느 정도의 독립성이 있기 때문에 ANOVA 검정은 여전히 ​​유용한 결과를 반환 할 수 있습니다. .

그러나 문제 를 줄임으로써 원본이 만족하지 않는 테스트를 사용할 수도 있습니다 . 독립 제약 조건을 명시 적으로 완화하면 결과가 보장되지는 않지만 의미가있을 수 있습니다 (결과가 줄어든 문제에 적용되므로 전체 문제이므로 새 문제의 추가 제약 조건이 테스트 및 결과에 영향을 미치지 않음을 증명할 수있는 경우를 제외하고 모든 결과를 번역 할 수는 없습니다.

실제로 이것은 종종 독립 데이터를 가정하는 모델을 사용하여 독립 변수 대신 종속 변수를 모델링하여 Naive Bayes를 사용하여 실제 데이터를 모델링하는 데 종종 사용 되며 놀랍게도 종종 모델 회계보다 훨씬 잘 작동합니다. 의존성 . 데이터가 모든 기대치를 정확하게 충족하지 않을 때 분산 분석을 사용하는 방법에 대한이 질문에 관심을 가질 수도 있습니다 .

요약 : 실제 데이터 를 다루려고하고 과학적 결과를 입증하는 것이 아니라 웹 서비스 또는 실제 응용 프로그램과 같이 작동하는 시스템 , 독립 가정 (및 기타 가정) 을 만드는 것이 목표 라면 편안한, 그러나 당신이하려고하는 경우 수 를 추론 / 몇 가지 일반적인 사실을 증명 , 당신은해야한다 항상 당신이 수있는 테스트를 사용 하면 것을 수학적으로 보증 (또는 적어도 안전하고라도 유용 가정) 모든 premisses 만족을 .


2
내가 당신의 주장을 올바르게 이해한다면, 가정이 정확히 충족되지 않은 통계의 적용은 유효하지 않다고 말하는 것부터 시작합니다. 사실이라면 이것은 매우 나쁜 소식입니다. 대부분의 계량 경제학 책 (단 하나의 예를 들기 위해)은 그것이 잘못되었다는 것을 설명하는 데 시간을 소비합니다 (단어 요약). 그러나 중간에 압정을 바꾸는 것처럼 보이며 대신 옹호하는 것은 희미합니다. 논리적으로 유효하지 않은 경우에도 데이터 작업은 건전 할 수 있습니다. 그러므로 여기에는 명확한 조언이 없습니다.
Nick Cox

요점은 다음과 같습니다. 선점을 위반하면 추론이 바이어스되므로 테스트 결과를 액면가로 취할 수 없습니다. 그러나 여전히 시도해 볼 수 있고 자신감이 있고 경험이 많으면 여전히 무언가를 얻을 수 있지만 실제로 과학적 추론에 신경 쓰지 않는 실제 구현에서 주로 모델링하려고합니다. 세계에 대한 근거가 분명한 일반적인 진실을 추론하려고 시도하지 않는 실용적인 목표에 대한 데이터). 그래서 내 대답은 "한 단어 요약"이 아니며 일반적인 경우 (잘못된) 대 특정 경우 (괜찮을 수도 있음)입니다.
gaborous

추신 : 내 진술은 통계 응용 프로그램뿐만 아니라 논리 또는 수학 정리 / 규칙 / 테스트의 응용에 관한 것입니다. 추론과 귀납을 사용한 추론은 사실입니다. 그러나 나는 당신의 계량 경제학 참고 문헌에 관심이 있습니다. OP의 질문에 대한 의견에서 당신이 제공 한 다른 심판은 매우 관련이 있습니다.
gaborous

의견을 추가해 주셔서 감사하지만 귀하의 진술이 특히 명확하거나 근거가 없다고 말해야합니다. 나는 일하는 과학자들 (나는 하나임)이 과학적 추론과 실제 목표에 대한 데이터 분석의 차이점을 파악할 수 없다는 것을 알 수 없습니다. Jeff Wooldridge의 교과서와 같은 교과서를 추천하는 것을 제외하고는 거기에 남겨 두겠습니다. amazon.com/Jeffrey-M.-Wooldridge/e/B001IGLWNY
Nick Cox

참조 주셔서 감사합니다. 방금 독립 변수가있는 데이터에 대해 순진한 독립 가정이 여전히 작동 할 수있는 이유를 설명하는 논문을 언급 한 또 다른 질문을 발견했습니다. 서로 다른 기능의 특징은 유사하거나 기능 간의 반대입니다 " stats.stackexchange.com/a/23491/25538
gaborous
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.