«data-visualization» 태그된 질문

데이터의 의미 있고 유용한 그래픽 표현 구성. (귀하의 질문이 특정 효과를 내기 위해 특정 소프트웨어를 얻는 방법에 관한 것이라면 여기서 다루지 않을 것입니다.)

4
QQ 플롯을 해석하는 방법
작은 데이터 세트 (21 개의 관찰)로 작업하고 있으며 R에 다음과 같은 정상적인 QQ 플롯이 있습니다. 음모가 정규성을 지원하지 않는 경우 기본 분포에 대해 무엇을 추론 할 수 있습니까? 오른쪽으로 치우친 분포가 더 적합 할 것 같습니다. 맞습니까? 또한 데이터에서 다른 결론을 도출 할 수 있습니까?

4
히스토그램을 기반으로 데이터의 근사 분포 평가
히스토그램 (즉, 오른쪽으로 기울어 짐)을 기반으로 내 데이터가 지수인지 여부를보고 싶다고 가정합니다. 데이터를 그룹화하거나 비우는 방법에 따라 크게 다른 히스토그램을 얻을 수 있습니다. 히스토그램의 한 세트는 데이터가 지수적인 것처럼 보입니다. 다른 세트는 데이터가 지수 적이 지 않은 것처럼 보일 것입니다. 히스토그램에서 분포를 잘 정의하려면 어떻게해야합니까?


1
plot.lm () 해석
R에서 plot (lm)에 의해 생성 된 그래프를 해석하는 것에 대한 질문이 있습니다. 스케일 위치 및 레버리지 잔류 플롯을 해석하는 방법을 알려주시겠습니까? 모든 의견을 부탁드립니다. 통계, 회귀 및 계량 경제학에 대한 기본 지식을 가정합니다.

3
예 : 이진 결과에 glmnet을 사용하는 LASSO 회귀
관심있는 결과가 이분법 인 LASSO Regressionglmnet 과 함께 사용하기 시작했습니다 . 아래에 작은 모의 데이터 프레임을 만들었습니다. age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

3
k- 평균 군집 분석 결과의 예쁜 플롯을 생성하는 방법은 무엇입니까?
K- 평균 군집화를 위해 R을 사용하고 있습니다. K- 평균을 실행하기 위해 14 개의 변수를 사용하고 있습니다 K- 평균의 결과를 나타내는 가장 좋은 방법은 무엇입니까? 기존 구현이 있습니까? 14 개의 변수가 있으면 결과를 작성하는 것이 복잡합니까? 멋져 보이는 GGcluster라는 것을 발견했지만 여전히 개발 중입니다. 나는 또한 sammon 매핑에 대해 읽었지만 그것을 …

8
기존 변수와 정의 된 상관 관계를 갖는 랜덤 변수 생성
시뮬레이션 연구를 위해 기존 변수 와의 미리 정의 된 (인구) 상관 관계를 나타내는 임의의 변수를 생성해야합니다 .YYY I는 들여다 R패키지 copula와 CDVine소정 의존성 구조 랜덤 변수 분포를 생성 할 수있다. 그러나 결과 변수 중 하나를 기존 변수에 고정 할 수 없습니다. 기존 기능에 대한 아이디어와 링크를 부탁드립니다! 결론 : 서로 …

4
주요 성분 분석과 비교하여 표준 상관 분석이 수행하는 작업을 시각화하는 방법은 무엇입니까?
정식 상관 분석 (CCA)은 주성분 분석 (PCA)과 관련된 기술입니다. 산점도를 사용하여 PCA 또는 선형 회귀를 가르치는 것은 쉽지만 (Google 이미지 검색에 대한 수천 가지 예 참조) CCA에 대한 유사한 직관적 인 2 차원 예는 보지 못했습니다. 선형 CCA의 기능을 시각적으로 설명하는 방법은 무엇입니까?

3
randomForest :: getTree ()에서 실제로 샘플 트리를 그리는 방법은 무엇입니까? [닫은]
누구나 실제로 몇 가지 샘플 트리 를 플롯하는 방법에 대한 라이브러리 또는 코드 제안이 있습니다. getTree(rfobj, k, labelVar=TRUE) (예를 들어, 당신 이이 작업을 수행하지 않아야한다는 것을 알고 있습니다. RF는 블랙 박스 등입니다.) 시각적으로 나무가 온전한 지 확인하여 변수가 반 직관적으로 작동하는지 확인하고, 조정 / 조합 / 분산 / 변환, 확인이 …


2
ggplot2에서 범례의 제목을 어떻게 변경합니까? [닫은]
2 x 4 x 3 셀 데이터 세트의 데이터를 요약하기 위해 ggplot2에서 만들고있는 플롯이 있습니다. 를 사용하여 2 레벨 변수에 대한 패널을 만들고 facet_grid(. ~ Age)를 사용하여 x 및 y 축을 설정할 수있었습니다 aes(x=4leveledVariable, y=DV). 나는 aes(group=3leveledvariable, lty=3leveledvariable)지금까지 줄거리를 만들었습니다. 이것은 2 레벨 변수로 표시되는 시각화를 제공합니다. X 축은 4 …

3
로그 스케일은 언제 적절합니까?
차트 / 그래프를 그릴 때 시계열 차트의 y 축과 같은 특정 상황에서 로그 스케일을 사용하는 것이 적절하다는 것을 읽었습니다. 그러나 왜 그런지 또는 적절한시기에 대한 명확한 설명을 찾지 못했습니다. 나는 통계학자가 아니기 때문에 그 요점을 완전히 잃어 버릴 수 있다는 점을 명심하십시오.



6
R의 ROC 곡선을 사용하여 최상의 차단 점과 신뢰 구간을 결정하는 방법은 무엇입니까?
정상 및 종양 세포를 구별하는 데 사용할 수있는 테스트 데이터가 있습니다. ROC 곡선에 따르면이 목적에 적합하게 보입니다 (곡선 영역은 0.9입니다). 내 질문은 : 이 시험의 차단 점과 측정 값이 모호한 것으로 판단되는 신뢰 구간을 결정하는 방법은 무엇입니까? 이것을 시각화하는 가장 좋은 방법은 무엇입니까 ggplot2? ROCR및 ggplot2패키지를 사용하여 그래프를 렌더링 합니다. …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.