"이 모든 데이터 포인트는 동일한 분포에서 나옵니다."테스트 방법?


16

이전에 여기서 논의한 주제를 본 것 같지만 구체적인 내용을 찾을 수 없었습니다. 그런 다음 다시 검색 할 내용이 확실하지 않습니다.

1 차원의 정렬 된 데이터 세트가 있습니다. 세트의 모든 점이 동일한 분포에서 도출된다는 가설을 세웁니다.

이 가설을 어떻게 테스트 할 수 있습니까? "이 데이터 세트의 관측치가 두 개의 다른 분포에서 도출 됨"의 일반적인 대안에 대해 테스트하는 것이 합리적입니까?

이상적으로는 "기타"분포에서 나온 점을 식별하고 싶습니다. 내 데이터가 주문되었으므로 어떻게 든 데이터를 자르는 것이 "유효한지"테스트 한 후 컷 포인트를 식별 할 수 있습니까?

편집 : Glen_b의 답변에 따라 엄격하게 긍정적이고 단조로운 분포에 관심이 있습니다. 또한 분포를 가정 한 다음 다른 모수 를 테스트하는 특별한 경우에 관심이 있습니다 .


"동일 분포"란 무엇을 의미합니까? 감마에 대한 관측치가 동일한 분포에서 나온 것으로 간주됩니까, 아니면 지수 분포의 합으로 간주됩니까?
Metariat

+1 이것은 당신이 스스로에게 물어 보는 좋은 질문입니다.
user541686

@Metallica 관측치가 지수 합계 인 한, 동일한 분포에서 온 것이라고 말할 수 있습니다
shadowtalker

@Mehrdad 저는 학사 학위와 석사 과정에서 몇 가지 기타 강의를 넘어 공식적인 통계 교육을받지 못했습니다. 내 대답 기록을 보면 선형 회귀에 대해 많이 알고 다른 것에 대해서는 많이 알지 못합니다. 🤐
shadowtalker

2
이 질문에 접근하는 한 가지 가능한 방법은 예를 들어 일부 분포 클래스의 유한 혼합을 고려하고 데이터를 잘 설명하기 위해 둘 이상의 혼합 구성 요소가 필요한지 여부를 확인하는 것입니다. 그러나 문제는 단일 혼합 성분으로 귀무 가설을 설명하기에 충분히 유연한 분포 유형이 있는지 여부입니다. 다 성분 혼합물로 가능한 대안을 포함하면서 행동하려는 행동에 따라 행동).
Björn

답변:


29

두 가지 시나리오를 상상해보십시오.

  1. 데이터 포인트는 모두 동일한 분포에서 도출되었습니다. (16,36)

  2. 데이터 포인트는 두 인구의 50-50 혼합에서 도출되었습니다.

    ㅏ. 다음과 같은 형태의 모집단 A :

여기에 이미지 설명을 입력하십시오

비. 다음과 같은 모양의 인구 B :

여기에 이미지 설명을 입력하십시오

...이 둘의 혼합이 1의 경우와 똑같이 보입니다.

그들은 어떻게 구별 될 수 있는가?

두 모집단에 대해 어떤 모양을 선택하든 항상 같은 모양을 가진 단일 모집단 분포가 있습니다. 이 주장은 일반적인 경우에는 단순히 할 수 없다는 것을 분명히 보여줍니다 . 구별 할 수있는 방법이 없습니다.

모집단 (가정, 효과적으로)에 대한 정보를 소개하는 경우 종종 진행할 수있는 방법이 있지만 * 일반적인 경우는 사망 한 것입니다.

* 예를 들어 인구가 단조롭고 다른 수단을 가지고 있다고 가정하면 어딘가에 갈 수 있습니다.

[질문에 추가 된 제한은 위에서 설명한 종류의 문제의 다른 버전을 피하기에 충분하지 않습니다. 우리는 여전히 양의 반선에 두 개의 단봉 분포의 50-50 혼합으로 단봉 널을 쓸 수 있습니다 긍정적 인 반줄에. 물론 더 구체적인 null이 있으면 문제가 훨씬 줄어 듭니다. 다른 대안으로 테스트 할 수있는 위치에 올 때까지 대안 클래스를 더 제한 할 수도 있습니다. 또는 널 (null)과 대안에 모두 추가 제한 사항이 적용되어 구별 할 수 있습니다.]


1
고마워, 좋은 반례. 대체 가설을 적절하게 제한하는 것입니다. 맞습니까?
shadowtalker

@ssdecontrol 예, 본질적으로; 대안이 널과 구별 될 수있는 경우 (가정을 제공 한 경우) 유의 수준보다 더 높은 검정력으로 검정 할 수 있습니다.
Glen_b-복지 주 모니카

0

분포와 테스트 할 가설에 대해 이야기 할 이론이 분명히 있어야합니다. 대상을 하나 이상의 그룹으로 그룹화하고 측정을 분리하는 것.

어떻게 갈 수 있습니까? 세 가지 옵션이 있습니다.

  • 주제에서 이미 알고 있다면 통계 가설의 언어로 번역하면됩니다.
  • 차트를 작성하고 패턴을 인식하여 테스트 할 가설이되도록합니다.
  • 적합 할 수있는 분포 목록을 구하고 수학 실험을 수행하십시오. 확률 프로그래밍은 키워드입니다

그런 다음 샘플에 하나 이상의 그룹이 있거나 하나만 있다고 결론을 내릴 수 있습니다. 아니면 전혀 그룹이 없습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.