로컬 모란의 I 통계량 (LISA)에 대한 p- 값 조정


10

spdep 패키지를 사용하여 R에서 탐색 적 공간 분석을하고 있습니다.

함수를 사용하여 계산 된 공간 연관 표시기 (LISA)의 p- 값 을 조정하는 옵션을 발견했습니다 localmoran. 문서에 따르면 목표는 다음과 같습니다.

... 여러 테스트에 대한 확률 값 조정.

또한 문서에서 p.adjustSP사용 가능한 옵션은 다음과 같습니다.

조정 방법에는 p- 값에 비교 횟수를 곱한 Bonferroni 수정 ( ' "bonferroni"')이 포함됩니다. Holm (1979) ( ' "holm"'), Hochberg (1988) ( ' "hochberg"'), Hommel (1988) ( 'hommel "') 및 Benjamini & Hochberg (1995)는 보수적 인 수정이 4 개 더 적었습니다. ( ' "fdr"')입니다. 통과 옵션 ( ' "없음"')도 포함되어 있습니다.

처음 네 가지 방법은 가족 별 오류율을 강력하게 제어하도록 설계되었습니다. 수정되지 않은 Bonferroni 수정은 Holm의 방법에 의해 지배되므로 임의의 가정 하에서도 유효하기 때문에 사용할 이유가 없습니다.

Hochberg와 Hommel의 방법은 가설 검정이 독립적이거나 음수가 아닌 경우에 유효합니다 (Sarkar, 1998; Sarkar and Chang, 1997). Hommel의 방법은 Hochberg보다 강력하지만 그 차이는 일반적으로 적으며 Hochberg p- 값은 계산 속도가 더 빠릅니다.

Benjamini, Hochberg 및 Yekutieli의 "BH"(일명 "fdr") 및 "BY"방법은 기각 된 가설 중 허위 발견의 예상 비율 인 허위 발견 비율을 제어합니다. 잘못된 발견 비율은 가족 별 오류율보다 덜 엄격한 조건이므로 이러한 방법은 다른 방법보다 강력합니다.

나타난 몇 가지 질문 :

  1. 간단히 말해서-이 조정의 목적은 무엇입니까?
  2. 그러한 수정을 사용해야합니까?
  3. 그렇다면 가능한 옵션 중에서 선택하는 방법은 무엇입니까?

1
이 질문은 CV에서 다루어 졌던 것과 매우 유사하므로이 질문을 마이그레이션했습니다. 예를 들어 검색 에서 배울 수있는 내용을 확인하십시오 .
whuber

@whuber 좋은 생각입니다. 나는 이력서에 대해 생각하지 않았지만 실제로는 더 나은 곳으로 보입니다. 감사.
radek

답변:


1

간단히 말해서, 직면 한 문제를 다중 가설 검정 이라고 합니다 . 이름에서 알 수 있듯이 많은 가설을 동시에 테스트 할 때 발생합니다.

검정에 대한 귀무 가설 (거짓 양성)을 부정확하게 기각 할 확률이 5 %라고 가정 해 봅시다. 테스트중인 데이터 세트 수 (이 경우 로컬 모란 통계량을 적용하는 각 세트)의 수를 늘리면 관찰 할 확률과 상관없이 데이터 세트에서 오 탐지가 발생할 확률이 증가합니다. 단일 데이터 세트에 대한 오 탐지율은 동일합니다.

이 문제를 해결하기 위해 발견 한 "수정"이 많이 있습니다. 지역 통계가 실제로 필요한 경우이를 피할 수 없습니다. 그렇지 않으면 전역 통계량을 단일 가설로 사용할 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.