Q1
생태 학자들은 항상 그라디언트에 대해 이야기합니다. 많은 종류의 그라디언트가 있지만 원하는 변수 또는 응답에 중요한 변수의 조합으로 생각하는 것이 가장 좋습니다. 따라서 구배는 시간, 공간, 토양 산도, 영양분 또는 어떤 식 으로든 반응에 필요한 다양한 변수의 선형 조합과 같은 더 복잡한 것일 수 있습니다.
우리는 공간이나 시간에있는 종을 관찰하기 때문에 그라디언트에 대해 이야기하고 전체 사물은 그 공간이나 시간에 따라 다릅니다.
2 분기
대부분의 경우 PCA의 말굽이 심각한 문제가 아니라고 나는 결론에 도달 한 경우에 당신이 발생하는 방법을 이해하고 "그라데이션이"실제로 PC1과 PC2 (잘으로 표시됩니다 걸릴 PC1 바보 같은 일을하지 않습니다 더 높은 PC로도 분할되지만 2 차원 표현은 괜찮습니다.)
CA에서 나는 똑같이 생각한다고 생각합니다 (지금 그것에 대해 조금 생각해야합니다). 이 솔루션은 데이터에 강한 2 차원이없는 경우 아치 축을 형성 할 수 있으므로 CA 축의 직교성 요구 사항을 만족하는 첫 번째 축의 접힌 버전이 데이터의 다른 방향보다 더 많은 "관성"을 설명합니다. 이것은 PCA를 사용하여 아치가 단일 지배적 구배를 따라 현장에서 종의 풍부함을 나타내는 방법 일뿐 인 구조로 만들어지기 때문에 더 심각 할 수 있습니다.
나는 사람들이 왜 강력한 말굽으로 PC1의 잘못된 주문에 대해 그렇게 많이 걱정하는지 이해하지 못했습니다. 이런 경우 PC1 만 가져 가지 말아야한다는 점에 반대하고 문제는 사라집니다. PC1과 PC2의 좌표 쌍은이 두 축 중 하나의 반전을 제거합니다.
Q3
PCA biplot에서 말굽을 보면 데이터가 단일 지배적 그라디언트 또는 변형 방향을 갖는 것으로 해석합니다.
아치를 보았을 때 아마도 같은 결론을 내릴 수 있지만 CA 축 2를 전혀 설명하려고 시도하는 것은 매우 조심 스러울 것입니다.
나는 DCA를 적용하지 않을 것입니다-그것은 아치를 비틀어 (최상의 상황에서) 2 차원 플롯에서 이상한 것을 보지 못하지만 많은 경우에 다이아몬드 또는 트럼펫 모양과 같은 다른 가짜 구조를 생성합니다. DCA 공간에서 샘플 배열. 예를 들면 다음과 같습니다.
library("vegan")
data(BCI)
plot(decorana(BCI), display = "sites", type = "p") ## does DCA
우리는 플롯의 왼쪽으로 샘플 포인트에서 일반적인 패닝을 봅니다.
Q4
m
이것은 데이터의 고차원 공간에서 비선형 방향을 찾는 것을 제안합니다. 그러한 방법 중 하나는 Hastie & Stuezel의 주요 곡선이지만 충분할 수있는 다른 비선형 매니 폴드 방법을 사용할 수 있습니다.
예를 들어, 일부 병리학 적 데이터의 경우
우리는 강한 말굽을 봅니다. 주 곡선은 데이터의 m 차원에서 부드러운 곡선을 통해 이러한 기본 기울기 또는 샘플의 배열 / 순서를 복구하려고합니다. 아래 그림은 반복 알고리즘이 기본 그래디언트를 근사하는 것으로 수렴하는 방법을 보여줍니다. (나는 더 높은 차원의 데이터에 더 가깝게하기 위해 플롯의 맨 위에있는 데이터에서 멀어지고 부분적으로 곡선이 주 곡선으로 선언되는 자기 일관성 기준으로 인해 생각합니다.)
이미지를 가져온 블로그 게시물의 코드를 포함한 자세한 내용 이 있습니다. 그러나 여기서 중요한 점은 주요 곡선이 알려진 샘플의 순서를 쉽게 복구하는 반면 PC1 또는 PC2 자체는 그렇지 않습니다.
PCA의 경우 생태학에 변형을 적용하는 것이 일반적입니다. 인기있는 변환은 유클리드 거리가 변환 된 데이터에서 계산 될 때 비 유클리드 거리를 반환한다고 생각할 수있는 변환입니다. 예를 들어, Hellinger 거리는
DHellinger(x1,x2)=∑j=1p[y1jy1+−−−−√−y2jy2+−−−−√]2−−−−−−−−−−−−−−−−−−⎷
yijjiyi+i
말굽은 생태학에서 오랫동안 알려져 왔으며 연구되었습니다. 초기 문헌 중 일부 (더 현대적인 모습)는
주요 주 곡선 참조는
전자는 매우 생태 학적 표현이다.