파라 메트릭 및 비 파라 메트릭 통계 테스트가 있습니까?


20

파라 메트릭 및 비 파라 메트릭 통계 테스트가 있습니까? 이 질문은 인터뷰 패널에 의해 요청되었습니다. 유효한 질문입니까?


1
비모수 통계에 대한 wikipedia 항목을 연구하면 면접관을 준비하기에 충분할 수 있습니다. "비모수? 분포가없는 모형 또는 순위 순서 통계량"이란 무엇입니까?와 같이 질문으로 질문에 대답 할 수 있습니다.
jrhorn424

3
출발 지점으로서, 응답자뿐만 아니라 응답자도 정의에 관한 권한 ( 인터넷이 아닌) 에 문의하는 데 도움이 될 수 있습니다 . " 파라 메트릭 사례 는 모든 [자연 상태]의 클래스가 자연적으로 유한 한 수의 실제 구성 요소로 구성된 벡터 로 표현 될 수있는 모든 사례 입니다. 손실 함수는 에 따라 합리적으로 매끄럽게 결정됩니다 .) 다른 모든 문제는 비모수 적이 라고 합니다 --JC 키퍼, 통계적 추론 소개, p. 23.θθθ
whuber

교수 중 한 사람은 'Chi-Square test'는 두 가지 행동 (모수 적 파라미터와 비모수 적)을 모두 가지고 있다고 말했습니다. 나는 왜 'chi square test'에 두 가지 행동이 있는지 전혀 이해하지 못했습니다.
Biostat

3
그것은 아니다 테스트 파라 메트릭, 그것은이의 모델 입니다. 카이 제곱 분포는 두 가지 상황 모두에서 발생합니다 (정규 분포 가정을 사용하는 일반 선형 모형에서 자연적인 방식으로, 로그 가능성의 차이에 대한 근사값 (모수 적 적용)과 다항식의 근사값으로 나타남) 많은 비모수 적 응용 프로그램에서 발생하는 분포)이므로 "chi-squared"라는 이름을 공유하는 다양한 테스트가 있습니다. 이것은 아마도 교수의 의견을 제안한 것입니다.
whuber

@ whuber : 마지막 의견은 적합도에 대한 카이 제곱 검정이 비모수임을 의미합니까?
Tim

답변:


6

"모수 테스트"와 "비모수 테스트"가 무엇을 의미하는지 정확하게 말하기는 근본적으로 어렵지만, 대부분 테스트가 모수인지 비모수인지에 동의하는 많은 구체적인 예가 있지만 (두 가지 모두는 아님) . 빠른 검색 으로이 표가 주어 졌으며 파라 메트릭 테스트와 비모수 테스트 사이의 일부 영역에서 공통적 인 실질적인 차이점을 나타냅니다.

언급 된 표 바로 위에 언급이 있습니다.

"... 모수 데이터에는 기본 정규 분포가 있습니다 .... 다른 것은 비모수입니다."

일부 영역에서는 정규성을 가정하고 분산 분석을 사용하는 것으로 인정되는 기준일 수 있으며, 이는 모수 적이거나 정규성을 가정하지 않고 비모수 적 대안을 사용합니다.

아마도 그다지 좋은 정의는 아니며 내 생각으로는 정확하지는 않지만 실용적인 경험이 될 수 있습니다. 예를 들어, 사회 과학의 최종 목표가 데이터를 분석하는 것이기 때문에 비정규 분포를 기반으로 모수 적 모델을 구성한 다음 데이터를 분석 할 수 없는 것이 무엇입니까?

다른 정의는 "비모수 적 테스트"를 분포 가정 및 모수 적 테스트에 의존하지 않는 테스트로 정의하는 것입니다.

전자와 후자의 정의는 하나의 테스트 클래스를 정의한 다음 다른 클래스를 보완 (다른 것)으로 정의합니다. 정의에 따르면, 테스트는 비모수적일뿐만 아니라 모수적일 수도 있습니다.

진실은 후자의 정의에도 문제가 있다는 것입니다. 대칭과 같이 자연스럽고 "비모수 적"인 가정이있을 수 있다면 어떨까요? 그렇지 않으면 분포 가정에 의존하지 않는 검정 통계량이 모수 검정으로 바뀔까요? 대부분은 거절합니다!

따라서 일부 분포 가정을 할 수 있습니다 비 - 파라 메트릭 테스트의 클래스의 시험이있다 만큼 그들은 "너무 파라 메트릭"아니기 때문에. "모수"와 "비모수"테스트의 경계가 흐려졌지만 대부분의 경우 테스트가 파라 메트릭이거나 비모수라는 것을지지합니다. 아마도 둘 다 아니라고 말할 수도 있습니다 거의 이해가되지 않습니다.

다른 관점에서 볼 때, 많은 모수 적 검정은 우도 비율 검정에 해당합니다. 이것은 일반적인 이론을 가능하게하며, 우리는 적절한 규칙적 조건 하에서 우도 비 검정의 분포 특성에 대한 통일 된 이해를 가지고 있습니다. 비 파라 메트릭 테스트는 우도 비 테스트에 해당하지 않는 반면에,있는 그 자체 가 될 가능성이 없다 - 우리가 경우에 따라 파생 분배 결과를 가지고있는 가능성을 기반으로 통합 방법론없이. 경험적 우도 이론그러나 Stanford의 Art Owen이 주로 개발 한 것은 매우 흥미로운 절충안입니다. 그것은 전형적인 매개 변수 분포 가정이 필요하지 않은 통계에 대한 우도 기반 접근법을 제공합니다 (예를 들어 값 보다 더 중요한 대상으로 가능성을 고려할 때 중요한 요점 ). 기본 아이디어는 경험적 데이터에 대한 다항식 분포를 영리하게 사용하는 것이며, 방법은 모수 적 가정을 제한하지 않고 매우 "모수 적"이지만 유효합니다.p

IMHO, 경험적 가능성을 기반으로 한 테스트에는 파라 메트릭 테스트의 장점과 비모수 테스트의 일반성이 있습니다. 따라서 내가 생각할 수있는 테스트 중 하나는 비모수적일뿐 아니라 비모수적일 수도 있습니다. 이 용어를 사용하지 마십시오.


+1 매우 흥미로운 의견. 경계선이 "흐리게"되는 한, 나는 그것을 인식대한 올바른 진술로 생각 하지만, 정의 자체에는 모호함이 없습니다. 모수와 비모수 사이의 구별은 유한 사이의 것만 큼 명확하고 예리합니다. 그리고 무한합니다.
whuber

@whuber, "흐리게"무엇인지에 대해, 나는 비모수 적 테스트에 대해서도 분포 가정이있을 수 있다는 사실을 구체적으로 언급 했으므로 두 번째 정의도 작동하지 않습니다. 명확한 정의를 시도해야하는 경우, 파라 메트릭 테스트는 유한 차원 유클리드 공간의 하위 집합으로 매개 변수화 할 수있는 모델을 기반으로합니다. 내가 가장 "흐리게"생각하는 것은 비모수 적 가정이 모수 적 가정만큼 문제가되기 전에 "분배 가정이 없다"는 것이 얼마나 멀리 있는지 명확하지 않다는 것입니다.
NRH

@ whuber, 이제 Kiefer와 관련하여 질문에 대한 귀하의 의견을 읽었습니다. 그렇습니다. 정식 정의 기관에 문의하는 것이 좋습니다. 나는 사람들 이 "비모수 적"이라고 말할 때 사람들이 일반적으로 무엇을 의미 하는지에 더 관심이 있었고 , 그들의 마음에 키퍼 정의가있는 사람은 거의 없다고 생각합니다.
NRH

원래 질문에 대한 주석에서 Kiefer의 인용문을 참조하십시오. 특히, "비모수 적"은 "분포 가정이 없음"을 의미하지 않습니다. 반대로, 가장 잘 알려진 비모수 적 테스트는 모두 분포 가정을합니다. 나는 "흐리게"라는 당신의 감각을 이해한다고 생각합니다 : 실제로는 매우 많은 (그러나 유한 한) 수의 매개 변수가 무한대로 간주 될 수 있기 때문에, 그것에 대해 유한 / 무한 유추를 선택했습니다.
whuber

2

파라 메트릭은 (적어도) 두 가지 의미로 사용됩니다. A- 노이즈 분포 패밀리를 파라미터까지 가정한다고 선언합니다. B- 설명 변수와 결과 사이의 특정 기능 관계를 가정한다고 선언합니다.

몇 가지 예 :

  • 선형 링크를 사용한 Quantile 회귀 분석은 B-parametric 및 A-non-parametric으로 규정됩니다.
  • 가우스 노이즈를 사용하여 시계열의 스플라인 스무딩은 A- 비모수 및 B- 파라미터의 품질로 할 수 있습니다.

"반모 수"라는 용어는 일반적으로 사례 B를 나타내며 전체 기능 관계를 가정하지 않고 "예측 자의 부드러운 변환에 가산 적"과 같은 약간의 가정을 가짐을 의미합니다.

분포의 모양을 구체적으로 지정하지 않고 "모든 모멘트가 유한합니다"와 같이 노이즈 분포에 대해 약간의 가정을 할 수도 있습니다. 내가 아는 한, 이러한 유형의 가정에 대한 용어는 없습니다.

답은 데이터 생성 프로세스의 기본 가정과 관련이 있습니다. "파라 메트릭 테스트"라고 말할 때 일반적으로 A는 비 파라 메트릭을 의미합니다. 이것이 의미하는 바에 따라 "아니오"라고 대답합니다. 동일한 의미에서 동시에 파라 메트릭 및 비 파라 메트릭이되는 것은 불가능합니다.


첫 번째 단락의 두 가지 의미는 종종 문헌에서 통일 된 치료법을 가지고 있습니다. 즉, 그들 사이에 근본적이거나 중요한 구별이없는 것으로 보입니다. BTW, "모든 순간이 유한하다"는 것은 비모수 적 문제이다.
whuber

@ whuber : Keifer의 정의는 두 경우 모두를 다루는 것 같습니다 (나는 그것을 읽지 않으며 여전히 예외를 찾고 있습니다). 반면에 용어는 의미를 변경합니다. "실증적 아기"는 더 이상 1955 년에 로빈스가 그것을 사용했던 것을 의미하지 않습니다. 둘 이상의 해석이 순환한다는 사실을 무시할 수 없습니다.
JohnRos

그러나, 우리는 조금 선택해야합니다. "파라 메트릭"과 "비 파라 메트릭"에 대한 많은 해석과 시도 된 정의는 이해가 아니라 무지의 표현입니다. 한 번에 명확하고 엄격하며 권위있는 대안 적 정의를 인용 할 수 있습니까 (신뢰할 수있는 동료 검토 저널에 의문의 여지없이 받아 들일 수 있다는 점에서 정확하고 권위있는)?
whuber

1
@ whuber : 나는 도전을 받아들입니다! :-) 모든 연구원이 Wikipedia에서 검색을 시작하므로 신뢰할 수있는 동료 검토 저널이 Wiki 정의와 일치 할 때까지는 시간 문제입니다. ( "당신이 그들을 이길 수 없다면 ...")
JohnRos

1
위키 피 디아 문서 ", 비모수"를 사용하는 것이 첫 번째입니다뿐만 아니라 1940 년대에서 울포위츠을 인용뿐만 아니라 키퍼의 직접 지적 조상 중 하나입니다. 나는 우리가 거기에 어떤 실제 차이를 찾을 수 있다고 생각하지 않습니다. (Kiefer는 손실 함수에 대한 기술적 요구 사항 만 추가합니다.) 그러나 필자는 수학적 기초가없는 분야에서는 그렇지 않은 진정한 연구원이 Wikipedia를 출발점으로 삼는 경우가 거의 없다고 생각합니다.
whuber

1

"모수 및 비모수"가 무엇을 의미하는지에 따라 다릅니다. 동시에 정확히 둘 다 또는 둘의 혼합?

많은 사람들은 Cox 비례 위험 모델이 기준 위험을 모수 적으로 추정하지 않기 때문에 반모 수적 모델이라고 생각합니다.

또는 많은 비모수 통계를 실제로 대규모 모수로 보도록 선택할 수 있습니다.


7
이것은 회피하는 것 같습니다. 문제는 명확하지 않은지 "파라 메트릭"과 "비 파라 메트릭"의 차이를 인식하는지 여부를 조사하는 것입니다. 좋은 대답은 그 차이점을 밝히고 혼동하지 않습니다.
whuber

1
@whuber 어느 "질문"? 패널 또는 OP? 내 생각에 OP는 어떤 것의 구별도 조사하지 않기 때문입니다. 그러면 사람들이 선을 그리는 위치에 따라 달라집니다. 나는 "글쎄, 그것은 의존한다"라는 공통적이고 철학적 인 예를 제공하는 것이 회피라고 생각하지 않는다. 나는 그것이 답이라고 생각합니다. "파라 메트릭"을 완전히 파라 메트릭으로 간주하거나 단순히 매개 변수를 갖는 것으로 고려할지 여부와 같습니다.
Fomite

"어떤 질문"에 대한 요점이 좋습니다. 귀하의 답변에 어려움을 겪기 시작한 부분은 내 자원에 따라 의미가 없다는 점을 구별하는 것입니다 ( "통합"은 의미가 없으며 "통계"가 매개 변수가 될 수 있다는 생각). "파라 메트릭"과 "비 파라 메트릭"의 정의를 내가 사용하는 것과 다릅니다. 답변이이 용어의 의미에 따라 달라져야한다는 점은 훌륭하지만 실제로 후속 의견을 명확하게 이해하기 위해 정의를 제공하지는 않습니다.
whuber

@whuber 공정합니다. 나는 원래의 질문이 다소 무의미하다는 것을 알았으므로 내가 할 수있는 일을하고있었습니다. 질문에는 이제 OP의 의미에 대한 몇 가지 가정을 만드는 더 나은 답변이 있습니다.
Fomite

0

Bradley는 그의 고전적인 무 분포 통계 테스트 (1968, p. 15–16- 이 질문 은 인용문을 참조하십시오 ) 에서 무 분포 테스트 와 비모수 테스트 사이의 차이점을 명확하게 설명 합니다. 중앙값에 대한 부호 검정으로서 모수 분포없는 검정의 예 . 이 테스트는 표본화 된 변수 값 모집단의 기본 분포에 대한 가정을하지 않으므로 분포가 없습니다 . 선택된 중앙값이 올바른 경우, 위와 아래의 값은 임의의 샘플을 테스트 동일한 확률로 선택되어야 로부터p=0.5

최신 정보

(A¬A)


1
흥미로운 답변을 만들고 좋은 참고 자료로 지원하기 때문에이 답변의 시작을 좋아합니다. 그러나 나머지 답변은 데이터에 대한 가정을 테스트 통계의 속성과 혼동하는 것으로 보입니다. 부호 테스트의 가정은 실제로 "배포 무료"입니다. 그러나 검정 통계량의 샘플링 분포가 이항이라는 사실은 완전히 별개의 문제 이며 절차를 파라 메트릭으로 만들지 않습니다!
whuber

글쎄, Bradley 자신은 15 페이지의 부호가없는 분포를 유지하면서도 모수 인 부호 테스트라고 부릅니다. 주석 상자가 너무 작아서 두 개의 핵심 문장을 완전히 표현할 수 없습니다. 다른 대답, 특히 "거의 말하기…"및 "완전히 명확하게하기 위해"로 시작하는 문장을 읽으십시오. 고맙습니다.
Avraham

그것이 브래들리 (Bradley)의 경우라면,이 용어들의 의미는 그 이후로 바뀌 었거나 (나는 그것을 싫어한다) 당신이 그가 쓴 것을 잘못 해석했다. (저는 확인할 수있는 사본에 액세스 할 수 없습니다.) "파라 메트릭"이 테스트 통계의 분포를 언급 한 것은 현재가 아니거나 적어도 지난 30 년 동안도 없었습니다. Wikipedia 기사 의 Wolfowitz 인용문을 참조하십시오 .
whuber

2
FΩθ

2
가치있는 것에 대해서는 DeGroot의 확률 및 통계 (2nd ed, pp 520-521)와 Larson의 확률 이론 및 통계적 추론 소개 (3 판, pp.508-509) 라는 두 가지 다른 통계 텍스트를 살펴 보았습니다 . 매개 변수 라는 용어는 Bradly가 Distribution-free 라고 부르는 것을 의미 하며, 이는 Kiefer와 같습니다. 따라서 OP에 응답하려면 "매개 변수"를 정의하는 방법에 따라 다릅니다.
Avraham
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.