«data-visualization» 태그된 질문

데이터의 의미 있고 유용한 그래픽 표현 구성. (귀하의 질문이 특정 효과를 내기 위해 특정 소프트웨어를 얻는 방법에 관한 것이라면 여기서 다루지 않을 것입니다.)

3
내 데이터는 어떤 분포를 따르나요?
1000 개의 구성 요소가 있고 이러한 로그에 몇 번의 로그 기록이 실패했는지 기록하고 실패를 기록 할 때마다 팀에서 문제를 해결하는 데 걸린 시간도 추적합니다. 요컨대,이 1000 개의 구성 요소 각각에 대한 복구 시간 (초)을 기록했습니다. 이 질문의 끝에 데이터가 제공됩니다. 나는이 모든 값을 가져다가 사용 R에 컬린과 프레이 그래프를 그린 …

7
수백만 점이 존재할 때 데이터를보다 효율적으로 플롯하는 통계적 방법?
수백만 개의 포인트가 존재할 때 R이 플롯을 생성하는 데 오랜 시간이 걸릴 수 있습니다. 포인트가 개별적으로 플롯 된 경우 놀랍지 않습니다. 또한, 그러한 음모는 종종 너무 복잡하고 조밀하여 유용하지 않습니다. 많은 점들이 겹치면서 검은 덩어리를 형성하며 많은 시간을 그 덩어리에 더 많은 점을 그리는 데 소비됩니다. 표준 산점도에서 큰 데이터 …

6
선 그래프에 선이 너무 많습니다. 더 나은 해결책이 있습니까?
시간이 지남에 따라 사용자 (이 경우 "좋아요")의 작업 수를 그래프로 표시하려고합니다. 그래서 저는 y 축으로 "행동 횟수"를 가지고 있고 x 축은 시간 (주)이며 각 줄은 한 명의 사용자를 나타냅니다. 내 문제는 약 100 명의 사용자에 대해이 데이터를보고 싶다는 것입니다. 선 그래프는 빠르게 100 개의 선으로 뒤죽박죽이됩니다. 이 정보를 표시하는 데 …

3
치료를 통해 데이터를 분리하는 산점도를 만들기 위해 R을 사용하는 좋은 방법은 무엇입니까?
나는 일반적으로 R과 통계에 매우 익숙하지만 기본 용량을 넘어서는 것으로 생각되는 산점도를 만들어야합니다. 나는 두 개의 관측치 벡터를 가지고 있으며 그것들과 함께 산점도를 만들고 싶어하며 각 쌍은 세 가지 범주 중 하나에 속합니다. 각 범주를 색상 또는 기호로 구분하는 산점도를 만들고 싶습니다. 나는 이것이 3 개의 다른 산점도를 생성하는 것보다 …

4
클래스 불균형 하에서 정밀 리콜 곡선 최적화
나는 많은 예측 변수가있는 분류 작업을 가지고 있는데 (그중 하나가 가장 유익합니다) MARS 모델을 사용하여 분류기를 구성하고 있습니다 (나는 간단한 모델에 관심이 있으며 설명을 위해 glms를 사용하는 것은 다음과 같습니다) 미세 너무). 이제 훈련 데이터 (각 양성 샘플에 대해 약 2700 개의 음성 샘플)에 큰 클래스 불균형이 있습니다. Information Retrieval …

3
많은 세트의 교차점 시각화
여러 세트의 교차점 겹침을 표시하는 데 적합한 시각화 모델이 있습니까? 나는 Venn 다이어그램과 같은 것을 생각하고 있지만 어떻게 든 10 개 이상의 많은 세트에 더 잘 빌려 줄 수 있습니다. Wikipedia는 더 높은 세트의 벤 다이어그램을 보여 주지만 4 세트의 다이어그램조차도 많이 사용됩니다. 데이터의 최종 결과에 대한 나의 추측은 많은 …

2
주요 성분 분석에서 이중 점 해석
나는이 훌륭한 튜토리얼 : R을 사용한 통계 분석 핸드북을 보았습니다. 13 장. 주요 구성 요소 분석 : R 언어로 PCA를 수행하는 방법에 대한 올림픽 헵타 슬론 그림 13.3의 해석을 이해하지 못합니다. 그래서 첫 번째 고유 벡터와 두 번째 고유 벡터를 플로팅하고 있습니다. 그게 무슨 뜻이야? 첫 번째 고유 벡터에 해당하는 …


3
두 개 이상의 회귀 모형에서 기울기를 비교하기 위해 어떤 테스트를 사용할 수 있습니까?
하나의 예측 변수에 대한 두 변수의 응답 차이를 테스트하고 싶습니다. 최소한의 재현 가능한 예는 다음과 같습니다. library(nlme) ## gls is used in the application; lm would suffice for this example m.set <- gls(Sepal.Length ~ Petal.Width, data = iris, subset = Species == "setosa") m.vir <- gls(Sepal.Length ~ Petal.Width, data = …

1
lmer 모델의 효과 반복 계산
방금 혼합 효과 모델링을 통해 측정의 반복성 (일명 신뢰성, 일명 클래스 내 상관 관계)을 계산하는 방법을 설명하는 이 문서를 보았습니다. R 코드는 다음과 같습니다. #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

6
파이 차트 문제
파이 차트에 대한 토론이 증가하고있는 것 같습니다. 이에 대한 주요 주장은 다음과 같습니다. 면적은 길이보다 전력이 적습니다. 파이 차트는 데이터 대 픽셀 비율이 매우 낮습니다. 그러나 비율을 묘사 할 때 어떻게 든 유용 할 수 있다고 생각합니다. 대부분의 경우 테이블을 사용하는 데 동의하지만 비즈니스 보고서를 작성할 때 원형 차트가없는 수백 …

6
깨진 축에 대한 대안은 무엇입니까?
사용자는 종종 축 값을 나누어서 동일한 그래프에 다른 크기의 데이터를 표시하려고합니다 ( 여기 참조 ). 이것이 편리 할 수도 있지만 항상 데이터를 표시하는 선호되는 방법은 아닙니다 (잘못 오도 할 수 있음). 몇 자릿수가 다른 데이터를 표시하는 다른 방법은 무엇입니까? 데이터를 로그 변환하거나 격자 그림을 사용하는 두 가지 방법을 생각할 수 …

4
제트기에 컬러 맵 비리 디스를 사용하는 이유는 무엇입니까?
https://www.youtube.com/watch?v=xAoljeRJ3lU에 발표 된 것처럼 Matplotlib은 기본 컬러 맵을 제트에서 비리 디스로 변경합니다. 그러나 나는 그것을 잘 이해하지 못합니다. 내가 색맹이라서? 오리지널 컬러 맵 제트는 매우 강해 보입니다. 대비를 느낄 수 있습니다. 새로운 컬러 맵 비리 디스에는 이러한 대비가 부족합니다. 누구든지 나를 위해 더 간단하게 설명해 주시겠습니까? 내 논문에 대한 줄거리가 …


4
R에서 시각적으로 매력적인 밀도 열지도 생성
R에 히트 맵을 생성하는 일련의 함수가 있다는 것을 알고 있지만 문제는 시각적으로 매력적인 맵을 생성 할 수 없다는 것입니다. 예를 들어 아래 이미지는 피하고 싶은 히트 맵의 좋은 예입니다. 첫 번째는 세부 사항이 명확하지 않지만 다른 점은 동일한 점을 기반으로 너무 유용하여 유용하지 않습니다. 두 플롯 모두 spatstat R 패키지 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.