«data-visualization» 태그된 질문

데이터의 의미 있고 유용한 그래픽 표현 구성. (귀하의 질문이 특정 효과를 내기 위해 특정 소프트웨어를 얻는 방법에 관한 것이라면 여기서 다루지 않을 것입니다.)

1
다중 대치 후 풀링 교정 플롯
다중 대치 후 교정 플롯 / 통계 풀링에 대한 조언을 원합니다. 미래 사건을 예측하기 위해 통계 모델을 개발하는 설정에서 (예를 들어, 병원 기록의 데이터를 사용하여 퇴원 후 생존 또는 사건을 예측하는 경우), 누락 된 정보가 많이 있다고 상상할 수 있습니다. 다중 대치는 이러한 상황을 처리하는 방법이지만 고유 한 대치 불확실성으로 …

4
반복 횟수가 증가함에 따라 그라디언트 부스팅 기계 정확도가 감소합니다.
caretR 의 패키지를 통해 그라디언트 부스팅 머신 알고리즘을 실험하고 있습니다 . 소규모 대학 입학 데이터 세트를 사용하여 다음 코드를 실행했습니다. library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

11
그래프에 세 가지 정보 표시
참고 : 이제 50 포인트의 원시 데이터가 첨부되었습니다. 일주일에 몇 주 동안 공부를했는지, 그리고 일주일 내내 얼마나 많은 페이지를 완료했는지를 보여 드리고자합니다. 사람들에게 그래프를 이해할 수 없다고 말하게했지만 그래프를 표시 할 수있는 방법을 모릅니다. 누적 묘사없이 본질적으로 3 차원이 필요하기 때문에. 몇 주 후에 그래프를 읽을 수 없게되므로 수많은 선 …

1
귀무 가설 하에서 교환 가능한 샘플의 직관은 무엇입니까?
순열 검정 (랜덤 화 검정, 재 랜덤 화 검정 또는 정확한 검정이라고도 함)은 매우 유용하며, 예를 들어 요구되는 정규 분포 가정이 t-test충족되지 않고 순위에 따라 값을 변환 할 때 유용합니다. 비모수 테스트 Mann-Whitney-U-test는 더 많은 정보가 손실 될 수 있습니다. 그러나 이러한 종류의 테스트를 사용할 때 단 하나의 가정 만 …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
LASSO 변수 추적 플롯 해석
나는 glmnet패키지를 처음 접했고 결과를 해석하는 방법을 여전히 확신하지 못한다. 누구든지 다음 추적 플롯을 읽도록 도와 줄 수 있습니까? 다음을 실행하여 그래프를 얻었습니다. library(glmnet) return <- matrix(ret.ff.zoo[which(index(ret.ff.zoo)==beta.df$date[2]), ]) data <- matrix(unlist(beta.df[which(beta.df$date==beta.df$date[2]), ][ ,-1]), ncol=num.factors) model <- cv.glmnet(data, return, standardize=TRUE) op <- par(mfrow=c(1, 2)) plot(model$glmnet.fit, "norm", label=TRUE) plot(model$glmnet.fit, "lambda", label=TRUE) par(op)

1
혼합 모델 결과 시각화
혼합 모델에서 항상 겪었던 문제 중 하나는 결과를 얻은 후에는 종이나 포스터로 끝날 수있는 데이터 시각화를 파악하는 것입니다. 지금은 다음과 같은 공식을 사용하여 포아송 혼합 효과 모델을 작업 중입니다. a <- glmer(counts ~ X + Y + Time + (Y + Time | Site) + offset(log(people)) glm ()에 맞는 것을 …

2
동전을 뒤집어 분류기 결합
기계 학습 과정을 공부하고 있는데 강의 슬라이드에는 권장 도서와 모순되는 내용이 포함되어 있습니다. 문제는 다음과 같습니다. 세 가지 분류 기가 있습니다. 낮은 범위의 임계 값에서 더 나은 성능을 제공하는 분류기 A 더 높은 범위의 임계 값에서 더 나은 성능을 제공하는 분류기 B 분류기 C p-coin을 뒤집고 두 분류기에서 선택하여 얻는 …

3
R을 사용하여 감소를 시각화하는 가장 좋은 방법은 무엇입니까?
이 사이트를 통해 최근에 Sankey Diagrams를 발견했습니다. Sankey Diagrams는 전통적인 순서도 에서 일어나는 일을 시각화하는 좋은 방법 입니다. 다음은 George M. Whitesides와 George W. Crabtree ( Source) 의 Sankey Diagram의 좋은 예입니다 . 2007 년 2 월 9 일, 과학에 관한 장기 기본 연구를 잊지 마십시오 : Vol. 315. 아니오 …

1
ggplot으로 계단 단계 함수를 그리는 방법은 무엇입니까?
잠김 . 이 질문과 주제는 주제가 다르지만 역사적 의미가 있기 때문에이 질문과 답변은 잠겨 있습니다. 현재 새로운 답변이나 상호 작용을받지 않습니다. 나는 이런 그래프를 가지고있다 : 그것을 생성하기위한 R 코드는 다음과 같습니다. DF <- data.frame(date = as.Date(runif(100, 0, 800),origin="2005-01-01"), outcome = rbinom(100, 1, 0.1)) DF <- DF[order(DF$DateVariable),] #Sort by date …

4
투표에 대한 평판의 영향에 대한 분석을 개선하려면 어떻게해야합니까?
최근에는 평판에 영향을 미치는 업 보트 ( blog-post 참조)에 대한 분석을 수행 한 후 , 더 많은 깨달음 (또는 더 적절한) 분석 및 그래픽에 대한 몇 가지 질문이있었습니다. 따라서 몇 가지 질문이 있습니다 (특히 누군가에게 자유롭게 대답하고 다른 사람들은 무시하십시오). 화신의 현재에서, 나는 포스트 번호의 중심을 의미하지 않았다. 포스트 카운트의 …

2
상자 그림에서 중앙값 대신 평균 표시 [닫기]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 3 개월 전 . 파이썬 matplotblib로 boxplot을 플로팅 할 때, 플롯의 중간 선은 분포의 중앙값입니다. 대신 평균 라인을 가질 가능성이 있습니까? 또는 다른 스타일로 옆에 플로팅합니다. 또한 …

5
많은 데이터를 그래픽으로 표시하는 좋은 방법
주택 데이터에 대한 14 개의 변수와 345,000 개의 관찰 (연도, 평방 피트, 판매 가격, 거주지 등)을 포함하는 프로젝트를 진행하고 있습니다. 좋은 그래픽 기술과 멋진 플로팅 기술을 포함하는 R 라이브러리를 찾으려고 노력하고 있습니다. 나는 ggplot과 격자에서 무엇이 잘 작동하는지 이미보고 있으며, 숫자 변수에 대한 바이올린 플롯을 생각하고 있습니다. 사람들이 명확하고 세련되며 …

8
"핸들 바"플롯에 대한 대체 그래픽
연구 분야에서 데이터를 표시하는 일반적인 방법은 막 대형 차트와 "핸들 막대"를 조합하여 사용하는 것입니다. 예를 들어 "핸들 바"는 작성자에 따라 표준 오류와 표준 편차를 번갈아 표시합니다. 일반적으로 각 "bar"의 샘플 크기는 약 6입니다. 이 음모는 생물 과학에서 특히 인기가있는 것으로 보입니다 . 예를 들어 BMC Biology 의 처음 몇 권을 …

1
여러 선형 모델에서 관계를 시각적으로 표현하는 가장 좋은 방법
저는 약 6 개의 예측 변수가있는 선형 모형을 가지고 있으며 추정치, F 값, p 값 등을 제시 할 것입니다. 그러나 단일 예측 변수의 개별 효과를 나타내는 가장 좋은 시각적 도표가 무엇인지 궁금했습니다. 응답 변수? 산포도? 조건부 플롯? 효과도? 기타? 그 음모를 어떻게 해석합니까? R 에서이 작업을 수행하므로 가능하면 예제를 자유롭게 …

3
클러스터링의 데이터 출력을 플롯하는 방법은 무엇입니까?
데이터 세트 (마크 세트)를 클러스터링하려고 시도하고 2 개의 클러스터를 얻었습니다. 그래픽으로 표현하고 싶습니다. (x, y) 좌표가 없기 때문에 표현에 대해 약간 혼란 스럽습니다. 또한 MATLAB / Python 함수를 찾고 있습니다. 편집하다 데이터를 게시하면 질문이 더 명확 해집니다. 파이썬에서 kmeans 클러스터링을 사용하여 만든 두 개의 클러스터가 있습니다 (scipy를 사용하지 않음). 그들은 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.