인쇄 된지도에 인구 통계 학적 데이터를 효과적으로 표시


29

인쇄 가능 / 비 대화식 맵에 영역 당 다음 (영역 30 개) 데이터를 표시하고 싶습니다.

  • 평균 연령
  • 평균 가계 수입
  • 세대수
  • 인구 밀도
  • 인원
  • 근로자 수

위의 6 개의 레이어를 하나의 맵에 효과적으로 표시하려면 어떻게해야합니까?


1
페이지 크기에 비해 영역이 얼마나 큽니까? 각 구역에 작은 줄거리를 맞출 수 있습니까? (예 : 레이더 차트)
djq

@celenius-일반적인 인구 조사 조사 유형으로 도심 지역은 교외 / 농촌 지역보다 현저히 작은 주거 지역보다 훨씬 작습니다.
dassouki

1
정적지도에서이 6 개의 레이어는 까다로운 디자인 작업입니다. 대화식지도 사용을 방해하는 문제는 무엇입니까?
Trevesy

@Trevesy-대부분의 경우 시각적 분석을 촉진하기 위해 6 가지 변수를 강조하는 인쇄 가능한 맵을 디자인해야합니다.
dassouki

1
시각화 태그를 추가 할 자유를 얻었습니다. 부적절한 것으로 생각되면 자유롭게 제거하십시오.
앤디 W

답변:


20

하나의지도에 모든 데이터를 포함시킬 수는 없으며 의미가 있습니다. Tufte의 작은 배수의 원리에 따라 같은 지역에 대해 각각 다른 변수를 사용하는 여러 개의 작은지도를 가지고 있다고 생각하는 것이 좋습니다. 예 : http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

그럼에도 불구하고 여러 유닛을 사용하고 있다는 문제가 있으므로 많은 키가 필요합니다. 데이터를 보는 또 다른 방법 (지도는 아님)은 모든 값이 표시된 표를 사용하는 것입니다 (예 : 평균 미만, 평균, 평균 이상에서는 다른 색상)

더 많은지도 아이디어는 센서스지도 책을 참조 하시기 바랍니다 : http://www.census.gov/population/www/cen2000/censusatlas/

의사 소통하려는 메시지가 무엇인지 (데이터 만있는 것이 아니라) 더 정확하게 반영하는 데 도움이 될 수 있습니다.


5
+1 한 번에 6 개의 변수를 상징하여 엉망으로 만드는 것보다 훨씬 낫습니다. 또한 데이터 테이블을 인쇄하지 않겠습니까? 6 개의 열 + id, 30 개의 행 : 충분히 작으며 누구나 필요한 모든 세부 사항을 제공합니다.
whuber

13

단일 맵에서 너무 많은 데이터를 효율적으로 표시 할 수 없습니다. 두 가지 가능성 :

  • 6 개의 맵을 생성하고

  • 데이터를 분석하여 지역을 분류하고 분류 결과를 표시하십시오. 주성분 분석은 당신의 변수 내에서 가장 중요한 상관 관계를 결정하는 데 도움이 될 수 있습니다. 이 방법은이 합성 맵을 생성하는 데 사용되었습니다.

대체 텍스트

이 것들에서 :

대체 텍스트 대체 텍스트


6 개의 맵을 갖는 문제는 시각적으로 추세를 결정하기 어렵다는 것입니다. 때로는 여러 변수가 포함
된지도를

2
@dassouki, 사물이 어떻게 정렬되는지 확인하기 위해 반드시 매핑 할 필요는 없습니다. 이변 량 산점도는 해당 기준을 충족하며 해석하기가 훨씬 쉽습니다.
Andy W

3
이점 6 개 맵을 갖는은 시각적으로 추세를 쉽게 식별 할 수 있다는 것입니다! 6 개 이상의 변수를 하나의 맵으로 묶으려고하면 패턴을 찾기가 어려워 질 수 있습니다. (이 맵에 수천 개의 기능이 포함 된 경우이 설명을 변경합니다. 글리프 시각화 와 같은 특정 유형의 맵핑 은 다양한 다변량 데이터 세트에서 패턴을 찾는 데 매우 효과적 일 수 있습니다. lmi.bwh.harvard.edu/papers/papers/ KindlmannTVCG2006.html )
whuber

@julien, 쿨 물건은, 당신은 그냥 건너 온이 문서에 관심이있을 수 있습니다, e-publications.org/ims/submission/index.php/AOAS/user/...은 , 그것은 유사한 다중 변량의 관련 PCA 분석과지도를 가지고 데이터를 작성하고 R 코드를 작성하여 플롯을 만듭니다.
Andy W

정말 흥미 롭습니다. 이것에 대해 읽어야합니다.
Neuhausr

9

작은 배수가 아마도이 문제에 접근하는 좋은 방법이라는 데 동의합니다. 지도를 보완하기 위해 변수의 산점도 행렬을 제안하여 이변 량 상관을 식별합니다. 데이터의 지리적 측면을 잃어 버리는 동안 산점도에서 변수 간의 관계를 시각화하는 것이 두 맵을 나란히 비교하는 것보다 훨씬 간단합니다.

그래도 어떤 종류의 공간 추세를 캡처하려면 분포 및 / 또는 원래 변수 사이에 공간 통계 (예 : 로컬 모란 I)를 포함시킬 수 있습니다.

편집 : 나는 최근 우주에서 다변량 관계를 시각화하는 목표를 가진 Andre-Michel Guerry (원래 1883 년)가 출판 한 도덕 통계를 재검토하는 몇 가지 작업을 보았습니다. 이러한 저자의 구현은이 스레드, 작은 배수, 주성분 분석, 산점도 행렬 및 다각형 다이어그램에서 제안 된 것과 매우 유사합니다. A.-M의 사진이 첨부되어 있습니다. 프랑스의 Guerry 's Moral Statistics : 다 변수 공간 분석의 도전 과제 : Michael Friendly Statistical Science, Vol. 22, No. 3. (2007 년 8 월), pp. 368-399 ( PDF 는 무료입니다). 또 다른 기사 ( Dray and Jombart, 2010 )는 동일한 데이터를 분석하고 R에 소스 코드를 사용하여 해당 플롯을 만듭니다.

하나는 산점도 행렬이고, 다른 하나는 스타 다이어그램 (Pablo가 제안한 막대 차트를 나타내는 다른 방법 임)입니다. 대체 텍스트 대체 텍스트


8

다음은 Andrew Gelman (및 회사 블로그) 통계 모델링, 인과 추론 및 사회 과학에 게시 된 작은 배수훌륭한 예입니다 . 이지도는 소득과 다양한 인종 및 종교 범주에 따라 주별로 학교 바우처에 대한 유권자 지원을 제공합니다. 백인 비 복음 주의자들은 학교 바우처를 정말로 좋아하지 않습니다! (2004 년 설문 조사 데이터에 나와 있지만 실제 블로그를 방문하면 해당 그룹의 학교 바우처에 대한 지원이 더 높아집니다). 여기에 이미지 설명을 입력하십시오


그래프는 멋지지만 컬러 스케일은 끔찍합니다. 회색으로 만들어 50 %가 왜 우선 순위가 높은가? 확실히 히트 맵 색상이나 무언가를 사용해야합니까? 또한 왜 오순절 사람들 만 종교로 나뉘어 있습니까? 틀림없이 인종과 종교로 나뉘는 것이 더 합리적일까요?
naught101

@ naught101, 나는 당신의 부정에 약간 혼란 스럽습니다. 스펙트럼의 양쪽 끝에서 더 밝거나 어두운 색상에 비해 반드시 회색이 강조되지 않습니다. IMO는 45 %로 임의로 분기되는 것에 대해 무의미하지만, 이와 같은 작은 다중 맵을 만들 때 IMO는 대비가 높은 값을 갖는 것이 유리합니다. 종교 / 인종 분열에 대한 의견은 IMO에도 의미가 없습니다. 이는 직종이 바우처를 지원하는지 여부와 관련 이있는 범주 이며 , 일부 하위 집합이 존재하지 않는 것 같습니다. 계속 ...
Andy W

IE 나는 설문 조사에 그러한 그룹에 대해 실질적인 말을하기에 충분한 "흑인 가톨릭 신자"가 존재한다고 의심한다. 서브 그룹을 포함한다.
앤디 W

어쩌면 화면에 특정 회색이 튀어 나온 것일 수도 있습니다. 나는 그것을 흰색과 회색 배경으로 더 좋을 것이라고 생각합니다. 또한 Gelman의 블로그에있는 두 이미지의 스케일이 다르다는 점에 주목할 가치가 있습니다. 저는 흑인 인구가 훨씬 더 높았다는 인상을 받았지만, 인구 조사 데이터를보고 수정했습니다. 한 가지 이상한 점은 인구 조사가 히스패닉계를 인종과 직교하는 것으로 정의한다는 것입니다 (별도의 질문입니다). Gelman의 구별이 다르게 정의 된 것 같습니다.
naught101

@ naught101 이것은 인구 조사에서 얻은 정보가 아니며 다른 조사에서 얻은 것입니다. (인구 조사에는 여론이 없습니다)
Andy W

5

여기에 제시된 솔루션 중에서 선택하기 위해 두 가지 주요 정보를 제공 할 수 있습니다.

  • 지도의 목적은 무엇입니까? (발견, 노출?)
  • 지도의 의도 된 대중은 무엇입니까? (당신, 동료 분석가, 도시 계획자, 공개?)

여기에 인용 된 솔루션은 목적 및 대중에 따라 다른 효율성을 가질 수 있습니다.

J. Bertin이 설명한 매트릭스 대각선 화 기술을 인용하여 Julien (PCA를 통한 하나의 합성 맵)의 대답을 일반화하고 싶습니다. 완전한 데이터 표현이 아닌 모든 정보의 종합을 추구 할 때 유용합니다.

간단히 말하면, 히스토그램으로 각 변수를 나타내는 것으로 구성되며, 값 (맵 영역)이 대각선으로 정렬되어 히스토그램을 정렬하여 유형을 얻을 수 있습니다.

대체 텍스트

(출처 : http://books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_similarbooks )


4

그것은 많은 정보이며 그것들을 주제별로 결합한 단일 맵이 시각적 오염으로 인해 쓸모없는 프리젠 테이션을 초래한다는 사실입니다. 반면에 30 개의 구역이 있으므로 각 구역에 대한 많은지도가 공해를 초래할 수 있습니다.

내 해결책 : 가장 중요한 정보를 선택하고 '가계 소득'이라고 말한 다음 일부 소득 범주에서지도를 구역화하십시오. 그리고 마지막으로 각 수입 지점에 대해 다른 5 개의 속성과 바 채팅을 작성하십시오.

예를 들어 "고소득 지역은 항상 많은 수의 근로자와 평균 연령이 21 세를 초과합니다"와 같은 비교를 할 수 있습니다.

예를보세요 ...

대체 텍스트


4

아마도 이러한 아이디어 중 일부가 도움이 될 수 있습니까?

6 개의 차원이 있다고 가정합니다.

1 : Choropleth : 가계 소득 사례 0

2, 3 및 4 : 기호 : 사람 수를 점으로 표시하여 배경을 볼 수 있습니다. 예 1, 예 2 근로자 / 비 근로자에 ​​대해 회색조를 사용하고 연령을 표시하는 다른 색 구성표

5 : 3D : 지형 예 3 으로 인구 밀도 사용

6 : (나는 여섯 번째 방법을 생각할 수 없다!)

'세대 수', '인구 밀도'및 '인원 수'를 표시하는 것이 중복됩니까?

이 복잡한 맵이 당신을 제외하고 누구에게나 분명하다면 나는 회의적입니다. 내가 발표했다면 먼저 각 요소를 따로 표시 한 다음 추가하여 청중이 단계를 이해할 수 있도록합니다.


하나의 대안 방법 (각 영역에 레이더 그래프를위한 공간이없는 경우이 정보를 나타내는 '글리프 (glyph)'를 만들 수 있습니다. 예 4, 그림 10.28을 . 이 경우에는 연결된 예제를 사용할 수 있습니다.


내가 가진 또 다른 생각은 다각형을 각 다각형에 대해 동일한 높이로 돌출 한 다음 높이 섹션을 사용하여 이러한 매개 변수를 나타내는 것입니다. 각 영역에 대한 막대 차트를 만드는 것과 비슷하지만 각 섹션이 비슷한 간격으로 맨 위에 쌓입니다. 이것은 3D에서 볼 필요가 있으며, 이는 일부가 가려 질 수 있음을 의미합니다.


나는 사랑하고 당신의 모든 제안을 의미합니다. 1-> 4를 구현할 계획입니다. 그러나 3D 물건 : 3D 맵을 사용할 때, 일반적으로 중앙에 위치한 도심 지역은 대부분의 고도를 확보하고 그 뒤에 많은 구역을 차단합니다.
dassouki

@ dassouki-나는 보통 경우에 동의합니다. 아마도 이것에 대해 큰 범위를 갖지 않는 변수 (평균 연령?)를 사용하거나 변수가 있다면 대수적으로 변환 할 수 있습니다.
djq

3
가능한 중복성에 관한 흥미로운 질문 : 인구 밀도는 면적에 대한 사람들의 수입니다 . 사람들의 수는 절대적인 수입니다. 그리고 가구 수는 사람들이 함께 사는 방법에 대한 정보를 제공합니다. 이 세 변수가 분명히 관련되어 있지만 회귀 분석에서 거의 공선 성 문제를 일으킬 수 있지만 실제로는 세 가지 다른 정보입니다. BTW, 그것은 "choropleth"입니다. (다행스럽게도 Google은이 오타를 인식하고 검색을 수행합니다.)
whuber

1
@ whuber-아마도 플래시를 사용하여 완료 된 것 같습니다 (슬프게도!).
djq

2
나는 3D의 제안에 대해 매우 의심 스럽다. AFAIK 아무도 3D를 사용할 수 있다는 것을 보여주지 못했습니다. San Fran 범죄와의 연계는 매우 단순하기 때문에 작동합니다. 더 복잡한 패턴은 해독하기가 어렵습니다. 이 경우 3D가 전혀 필요하다고 생각하지 않습니다.
Trevesy

2

어려운 과제입니다. 내 대답은 다변량 맵을 사용하는 것입니다. 이 맵을 확인하십시오 . 하나의 맵에 모든 변수를 표시하면 맵이 바쁘게 보입니다. 다변량 맵과 함께 선택하면 적절한 색 구성표를 선택해야합니다.


내가 작업하는 곳에서 Google 문서 도구가 차단되었습니다. (
dassouki


어느 쪽도 작동하지 않았고 파일 확장자가 없으면 파일을 긁을 수 없습니다.
dassouki

아직도 가지 ....
dassouki

내 측면에서 차단됩니다. :( 전자 메일을 통해지도를 보내도
괜찮습니다

0

단순화의 한 수준은지도 작성을 통해 인구 밀도와 같은 하나의 항목을 표현하는 것입니다. 즉, 인구에 비례하도록 각 단위의 영역을 왜곡합니다.

2008 년 미국 대통령 선거
(출처 : amherst.edu )

주요 단점은 시청자가 "일반적인"모양에서 영역의 왜곡을 인식 할 수 있어야한다는 것입니다.

자세한 정보는 여기 : http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf


1
나는 이것이 잠재적 인 가능성이 있다고 생각하지만,이 특정 상황 (동일한 공간에서 여러 속성을 동시에 보는)에 카르 토 그램을 얼마나 잘 적용 할 수 있는지는 확실하지 않습니다. 이론적으로는 여러 개의 작은 다중지도를 만들 수 있지만 해석하기 어려울 수 있습니다 (작은 배수에 필수적인 일종의 맵 간 일관성이 손실 됨). 여러 가지 속성을 표시하기 위해보다 흥미로운 방법으로지도를 색상과 결합 할 수 있습니다.
Andy W

1
작은 다중지도도의 예, gisandscience.com/2011/12/07/…
Andy W
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.