Mantel의 시험이 왜 Moran 's I보다 선호됩니까?


36

Mantel의 시험 은 생물학적 연구 , 예를 들어, 유전 적 관련성, 침략 속도 또는 다른 특성과 동물의 공간 분포 (공간에서의 위치) 사이의 상관 관계를 조사하기 위해 생물학적 연구에서 널리 사용됩니다 . 많은 좋은 저널들이 그것을 사용하고 있습니다 ( PNAS, Animal Behaviour, Molecular Ecology ... ).

자연에서 발생할 수있는 몇 가지 패턴을 만들었지 만 Mantel의 테스트 그 패턴 을 감지하는 데 매우 쓸모없는 것으로 보입니다. 반면에, Moran 's 는 더 나은 결과를 얻었습니다 (각 도표의 p- 값 참조) .

과학자들은 왜 대신 Moran 's I를 사용하지 않습니까? 보이지 않는 숨겨진 이유가 있습니까? 그리고 어떤 이유가 있다면 Mantel 또는 Moran의 I 테스트를 적절하게 사용하기 위해 어떻게 (가설이 다르게 구성되어야 하는지를) 알 수 있습니까? 실제 사례가 도움이 될 것입니다.

이 상황을 상상해보십시오 . 까마귀가 각 나무에 앉아있는 과수원 (17 x 17 나무)이 있습니다. 각 까마귀에 대한 "소음"수준을 사용할 수 있으며 까마귀의 공간 분포가 소음에 의해 결정되는지 알고 싶습니다.

5 가지 가능성이 있습니다 :

  1. "유유상종." 더 유사한 까마귀는 그들 사이의 지리적 거리가 더 작습니다 (단일 군집) .

  2. "유유상종." 다시 말하지만, 비슷한 까마귀가 많을수록 그들 사이의 지리적 거리는 더 적지 만 (여러 개의 클러스터) 시끄러운 까마귀의 한 클러스터는 두 번째 클러스터의 존재에 대해 알지 못합니다 (그렇지 않으면 하나의 큰 클러스터로 통합됨).

  3. "모노 닉 트렌드."

  4. "상대방은 매력적이다." 비슷한 까마귀는 서로 설 수 없습니다.

  5. "임의 패턴" 소음 수준은 공간 분포에 큰 영향을 미치지 않습니다.

각각의 경우에 대해 점의 그림을 만들고 Mantel 테스트를 사용하여 상관 관계를 계산했습니다 (결과가 중요하지 않다는 것은 놀라운 일이 아닙니다. 그런 점의 패턴 사이에서 선형 연관성을 찾지 않으려 고 시도하지는 않습니다).

여기에 이미지 설명을 입력하십시오


예시 데이터 : (가능한 압축)

r.gen   <- seq(-100,100,5)
r.val   <- sample(r.gen, 289, replace=TRUE)
z10     <- rep(0, times=10)
z11     <- rep(0, times=11)
r5      <- c(5,15,25,15,5)
r71     <- c(5,20,40,50,40,20,5)
r72     <- c(15,40,60,75,60,40,15)
r73     <- c(25,50,75,100,75,50,25)
rbPal   <- colorRampPalette(c("blue","red"))
my.data <- data.frame(x = rep(1:17, times=17),y = rep(1:17, each=17),
             c1=c(rep(0,times=155),r5,z11,r71,z10,r72,z10,r73,z10,r72,z10,r71,
             z11,r5,rep(0, times=27)),c2 = c(rep(0,times=19),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=29),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=27)),c3 = c(seq(20,100,5),
             seq(15,95,5),seq(10,90,5),seq(5,85,5),seq(0,80,5),seq(-5,75,5),
             seq(-10,70,5),seq(-15,65,5),seq(-20,60,5),seq(-25,55,5),seq(-30,50,5),
             seq(-35,45,5),seq(-40,40,5),seq(-45,35,5),seq(-50,30,5),seq(-55,25,5),
             seq(-60,20,5)),c4 = rep(c(0,100), length=289),c5 = sample(r.gen, 289, 
             replace=TRUE))

# adding colors
my.data$Col1 <- rbPal(10)[as.numeric(cut(my.data$c1,breaks = 10))]
my.data$Col2 <- rbPal(10)[as.numeric(cut(my.data$c2,breaks = 10))]
my.data$Col3 <- rbPal(10)[as.numeric(cut(my.data$c3,breaks = 10))]
my.data$Col4 <- rbPal(10)[as.numeric(cut(my.data$c4,breaks = 10))]
my.data$Col5 <- rbPal(10)[as.numeric(cut(my.data$c5,breaks = 10))]

지리적 거리의 행렬 만들기 (Moran 's I의 경우 반대) :

point.dists           <- dist(cbind(my.data$x, my.data$y))
point.dists.inv       <- 1/point.dists
point.dists.inv       <- as.matrix(point.dists.inv)
diag(point.dists.inv) <- 0

플롯 생성 :

X11(width=12, height=6)
par(mfrow=c(2,5))
par(mar=c(1,1,1,1))

library(ape)
for (i in 3:7) {
  my.res <- mantel.test(as.matrix(dist(my.data[ ,i])), as.matrix(point.dists))
  plot(my.data$x,my.data$y,pch=20,col=my.data[ ,c(i+5)], cex=2.5, xlab="", 
       ylab="", xaxt="n", yaxt="n", ylim=c(-4.5,17))
  text(4.5, -2.25, paste("Mantel's test", "\n z.stat =", round(my.res$z.stat, 
   2), "\n p.value =", round(my.res$p, 3)))

  my.res <- Moran.I(my.data[ ,i], point.dists.inv)
  text(12.5, -2.25, paste("Moran's I", "\n observed =", round(my.res$observed, 
   3), "\n expected =",round(my.res$expected,3), "\n std.dev =", 
       round(my.res$sd,3), "\n p.value =", round(my.res$p.value, 3)))
}

par(mar=c(5,4,4,2)+0.1)

for (i in 3:7) {
  plot(dist(my.data[ ,i]), point.dists,pch = 20, xlab="geographical distance", 
       ylab="behavioural distance")
}

UCLA의 통계 도움말 웹 사이트의 예에서 PS는 두 테스트 모두 정확히 동일한 데이터와 정확히 동일한 가설에 사용되며 그다지 도움되지 않습니다 (참조 : Mantel test , Moran 's I ).

IM에 응답 당신은 쓰기가 :

... [Mantel]은 조용한 까마귀가 다른 조용한 까마귀 근처에 위치하고 있는지, 시끄러운 까마귀에는 시끄러운 이웃이 있는지 테스트합니다.

그런 가설은 Mantel test로는 테스트 할 수 없다고 생각합니다 . 두 음모 모두 가설이 유효합니다. 그러나 시끄러운 까마귀의 한 클러스터가 시끄러운 까마귀의 두 번째 클러스터의 존재에 대한 지식을 가지고 있지 않다고 가정하면 Mantels 테스트는 다시 쓸모가 없습니다. 이러한 분리는 본질적으로 매우 가능해야합니다 (주로 대규모로 데이터 수집을 수행하는 경우).

여기에 이미지 설명을 입력하십시오

답변:


18

맨텔 테스트와 모란은 두 가지 매우 다른 개념을 말합니다.

Moran 's I을 사용하는 이유는 공간 자기 상관의 문제입니다. 공간을 통한 변수 자체와의 상관 관계입니다. 영역 단위에서 이벤트가 발생하는 정도가 인접 영역 단위에서 발생하는 가능성을 어느 정도 알고 싶어 할 때 Moran 's I을 사용합니다. 다시 말해 (예를 들어) : 나무에 시끄러운 까마귀가 있다면, 근처에 시끄러운 까마귀가있을 가능성은 얼마나됩니까? Moran 's I에 대한 귀무 가설은 관심 변수에서 공간 자기 상관이 아닙니다.

Mantel 테스트를 사용하는 이유는 변수 간의 유사점 또는 유사점에 대한 문제입니다. 예측 자 (공간) 변수와 유사한 샘플이 종속 (종) 변수와 유사한 경향이 있는지를 알고 자 할 때 Mantel 테스트를 사용합니다. 간단히 말해 : 서로 가까이있는 샘플도 구성 적으로 유사하며 공간적으로 서로 떨어져있는 샘플도 구성 적으로 유사하지 않습니까? 귀하의 예를 사용하면 : 조용한 까마귀가 다른 조용한 까마귀 근처에 있는지 여부를 테스트하고 시끄러운 까마귀에는 시끄러운 이웃이 있습니다. 귀무 가설은 공간 위치와 DV 사이의 관계가 없습니다.
이 외에도 부분 Mantel 테스트를 통해 두 변수를 비교하면서 세 번째 변수를 제어 할 수 있습니다.
예를 들어, 비교할 때 Mantel 테스트가 필요합니다

  • 동일한 세트의 샘플 단위를 형성하는 두 그룹의 유기체;
  • 교란 전후 공동체 구조;
  • 유전 적 / 생태적 거리 및 지리적 거리.

다음 은 Mantel 테스트 및 해당 응용 프로그램에 대한 좋은 설명입니다.

(Ladislav Nado의 새로운 예에 따라 편집)

내가 짐작할 수 있겠지만, 혼란의 이유는 두 개의 연속 변수 또는 하나의 거리 행렬 (공간의 위치)과 하나의 연속 변수 (노이즈)로 예제에서 공간과 노이즈를 계속 생각하기 때문입니다. 사실, 이러한 두 변수 사이의 유사성은, 하나의 생각해야한다 분석하는 모두 로의 거리 행렬 . 그건:

  • 하나의 행렬 (예 : 공간)은 각 지리적 좌표 쌍의 차이를 설명합니다. 서로 옆에 앉아있는 두 까마귀의 가치는 멀리 떨어져있는 까마귀의 가치보다 낮습니다.
  • 다른 매트릭스 (환경, 유전 또는 다른 구조의 경우)는 주어진 지점에서 측정 된 결과 사이의 차이를 설명합니다. 소음 수준이 비슷한 2 개의 까마귀 값 (조용하거나 소음이 있는지 여부는 중요하지 않습니다. 유사성에 불과합니다!)은 다른 소음 수준의 까마귀 쌍의 값보다 낮습니다.

그런 다음 Mantel 테스트는이 두 행렬에서 해당 값의 교차 곱을 계산합니다. 나를 다시 강조하자 벽난로 통계는이 거리 행렬 사이의 상관 관계이고 변수 간의 상관 관계와 일치하지 않는 그 행렬을 형성하기 위해 사용.

이제 그림 A와 B에 표시된 두 가지 구조를 살펴 보겠습니다
. 그림 A에서 각 까마귀 쌍의 거리는 소음 수준의 유사성에 해당합니다. 소음 수준에 작은 차이가있는 까마귀 (각 조용한 까마귀 대 다른 조용한 까마귀, 각 시끄러운 까마귀 대 다른 시끄러운 까마귀)는 소음 수준에 큰 차이가있는 각 까마귀 쌍 (조용한 까마귀)과 가까이 있습니다. 시끄러운 까마귀 대) 멀리 떨어져 있습니다. Mantel 테스트는 두 행렬 사이에 공간적 상관 관계가 있음을 올바르게 보여줍니다.
그러나 그림 B에서 까마귀 사이의 거리는 그렇지 않습니다.소음 수준의 유사성에 해당합니다. 시끄러운 까마귀가 모두 함께 머무르는 동안 조용한 까마귀는 가까이있을 수도 있고 가까이 있지 않을 수도 있습니다. 실제로, 한 쌍의 서로 다른 까마귀 (조용한 + 하나의 시끄러운) 쌍의 거리는 유사한 한 쌍의 까마귀 (조용한 경우)의 거리보다 작습니다.
그림 B에는 연구원이 두 개의 유사한 까마귀를 무작위로 집어 든다면 이웃이 될 것이라는 증거는 없다. 연구원이 인접한 (또는 먼 거리에 있지 않은) 까마귀 두 마리를 무작위로 집어들었다면 그것들이 비슷할 것이라는 증거는 없습니다. 따라서 초기 주장 On both plots the hypothesis valid이 잘못되었습니다. 그림 B에서와 같은 구조는 두 행렬 사이의 공간적 상관 관계를 나타내지 않으므로 Mantel 테스트에 실패합니다.

물론, 서로 다른 유형의 구조 (유사한 객체로 구성된 하나 이상의 클러스터 또는 명확한 클러스터 경계가 전혀 없음)가 실제로 존재합니다. Mantel 테스트는 완벽하게 적용 가능하며 테스트 대상 테스트에 매우 유용합니다. 다른 좋은 독서를 권유한다면 이 기사 는 실제 데이터를 사용하고 Moran 's I, Geary 's c 및 Mantel 테스트에 대해 매우 간단하고 이해하기 쉬운 용어로 설명합니다.

이제 모든 것이 조금 더 명확 해지기를 바랍니다. 그래도 여전히 누락 된 것이 있다고 생각되면이 설명을 확장 할 수 있습니다.


1
귀하의 답변에 감사드립니다, 그러나 당신이 작성한 가설 (실제 Mantel 검정 가설)은 실제 데이터에 유용하지 않다고 생각합니다. 위의 답변을 위에 추가하면 답변 해 주시면 매우 기쁩니다. 어쩌면 내가 틀렸을 수도 있습니다.
Ladislav Naďo

@ Ladislav Nado 나는 대답을 업데이트했습니다. 필요한 경우 추가 설명을 요청하는 것을 망설이지 마십시오.
IM

당신이 추천 한 기사를 "씹을"때 많은 감사를 드렸습니다.
Ladislav Naďo

1
트윗 담아 가기 도움이되어 기쁘다.
IM
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.