«data-visualization» 태그된 질문

데이터의 의미 있고 유용한 그래픽 표현 구성. (귀하의 질문이 특정 효과를 내기 위해 특정 소프트웨어를 얻는 방법에 관한 것이라면 여기서 다루지 않을 것입니다.)

4
눈금 선과 회색 배경은 차트로 표시되며 예외적으로 만 사용해야합니까?
대부분의 당국은 음모에서 어둡거나 눈에 띄는 눈금 선이 합리적인 정의에 의해 "차트 정크"이며 차트 본문의 메시지에서 시청자를 산만하게한다는 데 동의하는 것 같습니다. 그래서 나는 그 점에 대한 언급을 귀찮게하지 않을 것입니다. 마찬가지로 시청자에게 참조를 만들기 위해 창백한 격자 선 이 필요할 때가 있다는 데 모두 동의 할 수 있습니다. Tufte는 …

4
하나의 플롯에서 많은 변수 시각화
특정 변수의 값 (~ 15)이 시간이 지남에 따라 어떻게 변하는 지 보여주고 싶지만, 매년 변수가 어떻게 다른지 보여주고 싶습니다. 그래서 나는이 줄거리를 만들었습니다. 그러나 색 구성표를 변경하거나 다른 선 / 모양 유형을 추가 할 때도 지저분 해 보입니다. 이런 종류의 데이터를 시각화하는 더 좋은 방법이 있습니까? R 코드를 사용한 테스트 …

6
통계 그래픽을위한“hello, world”가 있습니까?
컴퓨터 프로그래밍에는 "hello, world"라고하는 새로운 언어 나 시스템을 배우고 가르치는 고전적인 최초의 프로그램이 있습니다. http://en.wikipedia.org/wiki/Hello_world_program 그래프 패키지를 사용하기위한 최초의 최초 데이터 시각화가 있습니까? 그렇다면 무엇입니까? 그렇지 않다면 좋은 후보는 무엇입니까?


6
분포를 비교하는 데 유용한 데이터 시각화 기술은 무엇입니까?
박사 학위 논문을 쓰고 있는데 분포를 비교하기 위해 상자 그림에 지나치게 의존한다는 것을 깨달았습니다. 이 작업을 수행하기위한 다른 대안은 무엇입니까? 또한 데이터 시각화에 대한 다른 아이디어로 나에게 영감을 줄 수있는 R 갤러리와 같은 다른 리소스를 알고 있는지 묻고 싶습니다.

3
리 커트 품목 응답 데이터 시각화
리 커트 응답 세트를 시각화하는 좋은 방법은 무엇입니까? 예를 들어, A, B, C, D, E, F & G에 대한 의사 결정에서 X의 중요성에 대해 문의하는 항목 집합? 누적 막 대형 차트보다 좋은 것이 있습니까? N / A의 응답으로 무엇을해야합니까? 그것들은 어떻게 표현 될 수 있습니까? 막 대형 차트에 백분율 또는 …

2
GAM에 상호 작용 용어를 포함시키는 방법은 무엇입니까?
다음 코드는 두 시계열의 유사성을 평가합니다. set.seed(10) RandData <- rnorm(8760*2) America <- rep(c('NewYork','Miami'),each=8760) Date = seq(from=as.POSIXct("1991-01-01 00:00"), to=as.POSIXct("1991-12-31 23:00"), length=8760) DatNew <- data.frame(Loc = America, Doy = as.numeric(format(Date,format = "%j")), Tod = as.numeric(format(Date,format = "%H")), Temp = RandData, DecTime = rep(seq(1, length(RandData)/2) / (length(RandData)/2), 2)) require(mgcv) mod1 <- gam(Temp ~ …

1
거대한 희박한 비상 대표를 시각화하는 방법?
약물 이름 (DN)과 이에 해당하는 이상 반응 (AE)이라는 두 가지 변수가 있는데, 이는 다 대다 관계에 있습니다. 33,556 개의 약물 이름과 9,516 개의 부작용이 있습니다. 표본 크기는 약 580 만 개의 관측치입니다. DN과 AE의 연관성 / 관계를 연구하고 이해하고 싶습니다. 그림을 보는 것이 더 낫기 때문에 R 에서이 세트를 시각화하는 …

3
t-SNE를 통해 시각화를위한 차원 축소가 "닫힌"문제로 간주되어야합니까?
차원 축소를위한 sne티티t 알고리즘에 대해 많이 읽었습니다 . MNIST와 같은 "클래식"데이터 세트의 성능에 깊은 인상을 받았습니다. MNIST는 숫자를 명확하게 구분합니다 ( 원본 기사 참조 ). 또한 훈련하는 신경망에서 배운 기능을 시각화하는 데 사용했으며 결과에 매우 만족했습니다. 그래서 내가 이해하는 것처럼 : -sne은 대부분의 데이터 세트에서 좋은 결과를 얻었 으며 Barnes-Hut …

2
윤곽선 / 열 오버레이가있는 산점도
잠김 . 이 질문과 주제는 주제가 다르지만 역사적 의미가 있기 때문에이 질문과 답변은 잠겨 있습니다. 현재 새로운 답변이나 상호 작용을받지 않습니다. 나는 최근의 논문을 보충 하여이 음모 를 보았고 나는 R을 사용하여 그것을 재현 할 수 있기를 원합니다. 그것은 산점도입니다. 과도 플로팅 밀도. 어떻게해야합니까?

3
모형의 예측 확률에 대한 보정 시각화
각 인스턴스에 대해 각 클래스에 대한 확률을 생성하는 예측 모델이 있다고 가정합니다. 이제 이러한 확률을 분류 (정밀도, 리콜 등)에 사용하려는 경우 이러한 모델을 평가할 수있는 여러 가지 방법이 있음을 알고 있습니다. 또한 ROC 곡선과 그 아래의 영역을 사용하여 모델이 클래스를 얼마나 잘 구별하는지 확인할 수 있습니다. 그것들은 내가 요구하는 것이 …

7
히트 맵은 "가장 효과적인 유형의 데이터 시각화 중 하나"입니까?
질문 : 열지도는 언제 (어떤 유형의 데이터 시각화 문제에 대해) 가장 효과적입니까? (특히, 다른 모든 가능한 시각화 기술보다 더 효과적입니까?) 히트 맵은 언제 가장 효과적입니까? 히트 맵이 데이터를 시각화하는 효과적인 방법인지 여부와 비효율적 인시기를 결정하는 데 사용할 수있는 일반적인 패턴이나 경험 법칙이 있습니까? (주로 나는 2 개의 범주 형 변수와 …

4
이 차트의 이름은 오 탐지율과 진양 율을 나타내며 어떻게 생성됩니까?
아래 이미지는 위양성 비율과 실제 양의 비율의 연속 곡선을 보여줍니다. 그러나 내가 즉시 얻지 못하는 것은 이러한 요율이 계산되는 방법입니다. 메소드가 데이터 세트에 적용되는 경우 특정 FP 속도 및 특정 FN 속도가 있습니다. 이것이 각 방법이 곡선이 아닌 단일 점을 가져야한다는 것을 의미하지 않습니까? 물론 방법을 구성하고 여러 가지 다른 …

4
우발 사태 테이블에 가장 적합한 시각화는 무엇입니까?
통계적 관점에서 우연히 카이 제곱 검정으로 분석되는 우발 사태 표 를 나타내는 가장 좋은 도표 는 무엇입니까? 피한 막대 그래프, 누적 막대 그래프, 히트 맵, 등고선도, 흔들린 산점도, 여러 줄 그림 등입니까? 절대 값 또는 백분율을 표시해야합니까? 편집 : 또는 @forecaster가 주석에서 제안하는 것처럼 숫자 표 자체는 단순한 음모이며 충분해야합니다.

2
다양한 조건에서 두 숫자 변수 간의 그래프 연결에 대한 팁이있는 우수한 온라인 리소스
문맥: 그 동안 나는 두 숫자 변수 사이의 연관성을 효과적으로 구성하는 방법에 대한 일련의 휴리스틱을 얻었습니다. 데이터를 다루는 대부분의 사람들이 비슷한 규칙을 가지고 있다고 생각합니다. 이러한 규칙의 예는 다음과 같습니다. 변수 중 하나가 양으로 치우친 경우 해당 축을 로그 스케일로 플로팅하는 것을 고려하십시오. 많은 데이터 포인트가있는 경우 (예 : n> …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.