좋은 색 강도 스케일을 만드는 방법은 무엇입니까?


12

나는 통계에 능숙하지 않지만, 내가 올바른 장소에 왔다고 생각한다. 내 질문은 간단합니다.

내 문제는 작은 나라의 여러 주 인구를 비교하는 것으로 구성되지만 일부 주에는 3000,000 명의 인구와 2,000 명의 인구가 있습니다.
지도에 그림을 칠하고 있으며 색상의 "강도"는 모든 국가의 인구가 전국의 인구와 어떻게 비교되는지에 달려 있습니다.

문제는 많은 인구를 가진 주들이 정말로 강렬한 색으로 표시되고 작은 주들은 거의 어떤 색도 가지고 있지 않다는 것입니다.

데이터를 "정상화"하거나 비교할 수있는 쉬운 방법이 있습니까?

나는 자신을 올바르게 설명하고 있는지 모르겠지만 어떤 사람이 나를 도울 수 있기를 바랍니다. 내 질문이 명확하지 않은 경우 의견을 말하면 명확하게 설명하겠습니다.

도와 주셔서 감사합니다!



1
같은 줄을 따라 www.0to255.com에서 그라디언트를 확인하십시오.
피트 윌슨

R에 대한 일부지도 패키지에는 이러한 종류의 문제를 방지하는 내장 색상 코드가 있지만 질문 한 것이 있습니까?
Fr.

나는 이것을 커스텀 맵에서 사용하고 있으며, (각 값을 총 모집단으로 나누는) 명확한 접근 방식은 0과 1 사이의 값을 제공합니다 (이 값을 사용하여 색상의 "강도"를 선택하십시오). 문제는 너무 많은 값이 적용되어 일부 상태는 완전히 색이 보이고 일부는 색이 거의 없다는 것입니다. 통계적으로 말하면 이것이 정확하다는 것을 알고 있지만 데이터 표현을보다 관련 있고 이해하기 쉽게 만들고 싶습니다.
Zebs

왜 균일 한 휴식을 사용합니까? 왜 로그 스케일이 아닙니까? 또는 응용 프로그램에서 의미가있는 중단 점 (예 : 시골 / 교외 / 도시)을 선택할 수 있습니다.
JMS

답변:


6

미안하지만 나에게 당신이 부서지지 않은 것을 고치려고하는 것처럼 들립니다. 사실, 깨지지 않은 것을 깨뜨 리려고 할 수도 있습니다. 광범위한 범위에 걸쳐있는 양적 변수 (여기서는 모집단)가있는 경우이를 나타내는 데 사용하는 모든 메트릭도 넓은 범위에 걸쳐 있어야합니다.

하지만 색상 (예 :지도)과 관련된 모든 것의 핵심 소스는 ColorBrewer입니다.


2
나는 무언가를 깨뜨 리려고 노력하고있다. 내가받는 골짜기가 통계적으로 정확하다는 것을 알고 있지만 사용자가 데이터를 쉽게 이해할 수 있기를 원합니다. UI 결정입니다.
Zebs

@Zebs : 벤드, 더 ..
naught101

5

좋은 질문입니다. 하나의 해결책은 색상을 더 균일하게 분포 시키거나 꼬리가 낮은 분포로 조정하는 것입니다. 그러나 스케일을 변형시키는 것이 불공평하기 때문에 범례가 명확해야합니다 ...

예를 들어, R에서 법선을 제곱으로 재조정합니다. (꼬리가 크고 꼬리를 작게 원하기 때문에 다른 방법으로 갈 수 있지만 원칙은 같습니다)

X=array(rnorm(10000),c(100,100))
ramp=colorRamp(c("blue","cyan","white","yellow","red"),space ="rgb")
kleur <- rgb( ramp(seq(0,1,length=200)),max = 255)
par(mfrow=c(1,2))
image(X,col=kleur)### image without rescaling
Fn=ecdf(X)
ScaledX=array(Fn(X),c(100,100))
image(ScaledX,col=kleur)

3

총 인구로 나눌 수 있습니다. 이렇게하면 모든 것이 0과 1 사이에있게됩니다. 스케일이 여전히 너무 다른 경우 로그 스케일을 고려하십시오.


2

어색한 느낌이 들지만 실제로 양을 표현 하기 위해 색상 을 사용하기 위해 노력하고 있습니까? 높이가 수량을 나타내는 각 상태에 막대를 넣을 방법이 없습니까?

어떻게 '유사 - 또 다른 방법은 함께 각 국가의 지역은 인구 규모에 비례하는지도, 지리적 영역을 나타내는 영역과지도를 표시 할 수있는 감각 호문클루스는 않습니다. 그러나 그것은 고통스러운 양의 그림이 될 것입니다-나는 그것을 자동화 할 수있는 방법을 모르겠습니다 (존재하더라도)


좋은 말!
로빈 지라드

4
많은 매핑 소프트웨어 플랫폼에는이 게시물에 언급 된 기능이 있습니다. 지도에 대한 속성을 기반으로 한 왜곡을 종종지도 제작이라고합니다. gis.stackexchange.com/q/7406/751을 참조하십시오 . 즉, 맵에 배치 된 막대는 색상보다 시각화하기가 쉽지 않습니다. 막대가 나란히 있지 않으면 상대 비교를하기가 어렵습니다. 이는 색상 스케일에 큰 문제가되지 않습니다.
앤디 W

지도에서 막대가 최적보다 적다는 데 동의합니다. 이를 수행하는 또 다른 방법은 viewsoftheworld.net/?p=832 와 같이 그리드 왜곡을 갖는 것입니다 . 개인적으로, 나는 종종 이것을 해독하기가 어렵다는 것을 알지만, 왜곡의 양에 따라 상당히 잘 할 수 있습니다.
naught101

1

명시된 목표 :

소규모 국가의 여러 주 인구를 비교하십시오.

명시된 문제 :

일부 주에는 인구가 3000,000 명이고 일부 주에는 2,000 명이 있기 때문에. 데이터를 "정상화"하거나 비교할 수있는 쉬운 방법이 있습니까?

매핑하기 전에 데이터를 표준화하는 목표

왜 당신이지도를 만드는지에 대한 내용이 확실하지 않기 때문에이 답변은 부족할 것입니다.

그럼에도 불구하고 다음과 같은 몇 가지 사항을 살펴보십시오. 데이터를 정규화하여 맵이 잠재적 인 독자에게 흥미로운 의미를 제공하므로 맵에서 보는 내용을 일반적으로 생각하는 일부 개념에 연결할 수 있습니다. 기본적으로, 새로운 정규화 된 숫자는 맵 리더가 이해하기 쉬운 질적 개념과 연결되어야한다고 생각합니다 (무작위 tidbit : 측정 = 수량 x 품질, 헤겔).

데이터를 정규화하는 두 가지 제안 된 방법

1. 각 주에 얼마나 많은 열린 공간이 있는지 이해하기 위해.

모집단을 전체 주 영역으로 나눈 값을 계산하여 모집단 밀도에 대한 새로운 상태 변수를 작성하십시오.

2. 상태의 채색을 서로 대조하기 위해.

각 상태의 평균과의 편차를 계산하여 새 상태 변수를 만듭니다. 예를 들어, 다음과 같이 인구가있는 3 개의 주가 있다고 가정하십시오.

  • 상태 A는 100입니다.
  • 상태 B는 50입니다.
  • 상태 C는 1입니다.

평균은 약 50입니다.

각 상태에 대한 새 변수의 값은 다음과 같습니다.

  • 상태 A는 +50 (컬러 강렬한 녹색 )입니다.
  • 상태 B는 0 ( 회색 )입니다.
  • 상태 C는 -49 (컬러 강렬한 빨간색 )입니다.

양수가 음수와 대조되는 모든 색 구성표를 사용할 수 있습니다 (지도의 색 구성표 예는 Google 'colorbrewer').

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.