포인트 다양성을 시각화하기위한 히트 맵 알고리즘


18

포인트 다양성을 시각화하기위한 히트 맵을 생성하는 알고리즘을 제안 할 수 있습니까? 응용 프로그램의 예로는 종 다양성이 높은 영역을 매핑 할 수 있습니다. 일부 종의 경우 모든 단일 식물이 매핑되어 높은 점수를 얻지 만 지역의 다양성 측면에서는 거의 의미가 없습니다. 다른 지역은 진정으로 다양성이 높습니다.

다음 입력 데이터를 고려하십시오.

x    y      cat
0.8  8.1    B
1.1  8.9    A
1.6  7.7    C
2.2  8.2    D
7.5  0.9    A
7.5  1.2    A
8.1  1.5    A
8.7  0.3    A
1.9  2.1    B
4.5  7.0    C
3.8  4.0    D
6.6  4.8    A
6.2  2.4    B
2.2  9.1    B
1.7  4.7    C
7.5  7.3    D
9.2  1.2    A

결과지도 :

그리드 플롯

왼쪽 위 사분면에는 매우 다양한 패치가 있고 오른쪽 아래 사분면에는 높은 점 농도가 있지만 다양성이 낮은 영역이 있습니다. 다양성을 시각화하는 두 가지 방법은 기존 히트 맵을 사용하거나 각 다각형에 표시된 범주의 수를 세는 것입니다. 다음 이미지에서 알 수 있듯이 열지도는 오른쪽 아래에서 가장 큰 강도를 나타 내기 때문에 이러한 접근 방식은 사용이 제한적이며 범주가 하나만 있으면 비닝 접근 방식이 정확히 동일하게 나타납니다 (이 크기는 다각형 저장소를 사용하지만 결과는 불필요하게 세분화됩니다.

히트 맵 여기에 이미지 설명을 입력하십시오

내가 생각한 한 가지 접근법은 정의 된 반경 내에서 다른 범주의 포인트 수로 전통적인 히트 맵 알고리즘을 준비한 다음 히트 맵을 생성 할 때 해당 카운트를 포인트의 가중치로 사용하는 것입니다. 그러나 나는 이것이 매우 날카로운 결과를 초래하는 상호 강화와 같은 원치 않는 인공물이 발생하기 쉽다고 생각합니다. 또한, 같은 유형의 밀접하게 매핑 된 점은 같은 정도로가 아니라 계속해서 높은 농도로 나타납니다.

또 다른 접근법 (아마도 더 우수하지만 계산 비용이 많이 드는)은 다음과 같습니다.

  1. 데이터 세트의 총 범주 수 계산
  2. 출력 이미지의 각 픽셀에 대해 :
    • 각 카테고리마다 :
      • 가장 가까운 대표 지점까지의 거리를 계산합니다 (r) [영향을 무시할 수있는 반경을 약간 초과했을 가능성이 있음]
      • 1 / r 2에 비례하는 가중치를 추가

내가 알지 못하는 알고리즘이나 다양성을 시각화하는 다른 방법이 이미 있습니까?

편집하다

Tomislav Muic의 제안에 따라 각 범주에 대한 히트 맵을 계산하고 다음 공식 (QGIS 래스터 계산기)을 사용하여 정규화했습니다.

((heatmap_A@1 >= 1) + (heatmap_A@1 < 1) * heatmap_A@1) +
((heatmap_B@1 >= 1) + (heatmap_B@1 < 1) * heatmap_B@1) +
((heatmap_C@1 >= 1) + (heatmap_C@1 < 1) * heatmap_C@1) +
((heatmap_D@1 >= 1) + (heatmap_D@1 < 1) * heatmap_D@1)

다음과 같은 결과 (그의 답변 아래 의견) : 정규화 된 합계


1
두 번째 접근법은 좋아 보입니다. 이것은 주로 통계 문제이므로 CRAN 에서 해당 R 루틴을 살펴보기 시작 합니다. 그래도 다양한 그리드 크기를 실험하고 바퀴를 재발 명하지 않도록 '공식적인'생물 다양성 척도를 찾으십시오.
Deer Hunter

답변:


4

개별 범주별로 히트 맵을 만들어보십시오.

그런 다음 히트 맵을 합산하고 범주 수를 사용하여 히트 맵을 정규화하십시오.

탐험 해 볼 가치가 있습니다.


이 제안에 따라 질문에 시각화를 추가했으며 결과가 좋아 보입니다! 단점은 수백 또는 수천 개의 범주를 다루는 경우 모든 래스터를 저장하는 것이 문제가된다는 것입니다.
rudivonstaden

생각해 보면, 각 카테고리 이후에 각각의 새로운 히트 맵을 복합 히트 맵에 추가해도 문제가되지 않습니다. 문제는 래스터 합계 또는 픽셀 별 계산을 구현하기 위해 계산 방식이 더 빠른 방법입니다.
rudivonstaden

이 답변이 다양성과 관련이 없다고 생각합니다. 결과 합계 (및 정규화)에서 여러 그룹이있는 매우 밀도가 높은 영역은 밀도가 아니라 하나의 그룹이있는 영역과 동일하게 보입니다.
Andy W
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.