«data-visualization» 태그된 질문

데이터의 의미 있고 유용한 그래픽 표현 구성. (귀하의 질문이 특정 효과를 내기 위해 특정 소프트웨어를 얻는 방법에 관한 것이라면 여기서 다루지 않을 것입니다.)

6
그래프 이론-분석 및 시각화
나는 그 주제가 CrossValidated 관심사에 들어가는 지 확신 할 수 없다. 말해 줄게 그래프 ( 그래프 이론에서 ) 즉 , 공부해야합니다 . 연결되어있는 특정 수의 점이 있습니다. 모든 점과 각 점이 의존하는 점이있는 테이블이 있습니다. (또한 관련이있는 또 다른 테이블이 있습니다) 내 질문은 : 쉽게 연구하기 좋은 소프트웨어 (또는 R …

3
부분 의존도의 y 축 해석
이 질문은 교차 검증에서 답변 될 수 있기 때문에 스택 오버플 로 에서 마이그레이션 되었습니다. 5 년 전에 마이그레이션 되었습니다 . 부분 의존성 플롯에 대한 다른 주제를 읽었으며 대부분은 정확하게 해석 할 수있는 방법이 아니라 다른 패키지로 실제로 플롯하는 방법에 관한 것입니다. 나는 상당한 양의 부분 의존도를 읽고 작성해 왔습니다. …

1
t-SNE 대 MDS
최근 t-SNE ( t-Distributed Stochastic Neighbor Embedding ) 에 대한 질문을 읽고 MDS ( Multidimensional Scaling )에 대한 질문도 방문했습니다 . 그것들은 종종 유사하게 사용되므로 여기에 별도로 (또는 PCA 와 비교하여 ) 둘 다에 많은 질문이 있음을 보는 것이 좋습니다 . 요컨대 t-SNE와 MDS의 차이점은 무엇입니까? 예. 그들이 탐구하는 데이터 …

8
세 가지 범주 형 변수 사이의 관계를 어떻게 시각화 할 수 있습니까?
세 가지 범주 형 변수가있는 데이터 세트가 있고 하나의 그래프에서 세 가지의 관계를 시각화하고 싶습니다. 어떤 아이디어? 현재 다음 세 가지 그래프를 사용하고 있습니다. 각 그래프는 일정 수준의 우울함 (가벼움, 보통, 심각)에 대한 것입니다. 그런 다음 각 그래프에서 치료 (0,1)와 우울증 개선 (없음, 보통, 실질적) 사이의 관계를 살펴 봅니다. 이 …


4
PCA 공간에 새로운 벡터를 투영하는 방법?
주성분 분석 (PCA)을 수행 한 후 PCA 공간에 새 벡터를 투영하려고합니다 (즉, PCA 좌표계에서 해당 좌표를 찾습니다). 를 사용하여 R 언어로 PCA를 계산했습니다 prcomp. 이제 내 벡터에 PCA 회전 행렬을 곱할 수 있어야합니다. 이 매트릭스의 주요 구성 요소를 행 또는 열로 배열해야합니까?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

14
쉽고 견고한 데이터 탐색을위한 소프트웨어
스프레드 시트 대항에 맞서려는 노력에서 필자는 종종 통계 소프트웨어 (R, Stata 등)와 같은보다 강력한 도구를 추진하는 데 복음을 전합니다. 최근에 나는 단순히 프로그래밍을 배우지 않을 것이라고 평평한 사람이이 견해에 도전했습니다. 나는 프로그래밍이 필요없는 데이터 분석 도구를 제공하고 싶습니다 (그러나 나중에 발가락을 물에 담그기로 결정하면 프로그래밍으로 확장되는 것이 이상적입니다). 데이터 탐색을 …

4
엣지 케이스의 정밀도 및 리콜에 대한 올바른 값은 무엇입니까?
정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

7
상자 그림에 대한 대안은 무엇입니까?
사용자가 선택한 다각형에 대한 인구 조사 데이터를 표시하고 다양한 매개 변수 (매개 변수 당 하나의 그래프)의 분포를 그래픽으로 표시하려는 웹 사이트를 만드는 중입니다. 데이터에는 일반적으로 다음과 같은 속성이 있습니다. 샘플 크기가 큰 경향이 있습니다 (예 : 약 10,000 개의 데이터 포인트) 값의 범위는 크게 요구되는 경향이 있습니다 (예 : 최소 …

3
연결된 두 개의 점이있는 행이있는이 플롯의 이름은 무엇입니까?
나는 EIA 보고서를 읽었으며이 줄거리는 나의 관심을 끌었다. 이제 동일한 유형의 플롯을 만들 수 있기를 원합니다. 그것은 2 년 (1990-2015) 사이의 에너지 생산성 진화를 보여주고이 두 기간 사이의 변화 가치를 더합니다. 이 유형의 줄거리의 이름은 무엇입니까? Excel에서 동일한 플롯을 다른 국가와 함께 만들려면 어떻게해야합니까?

1
상자 그림의 역사는 무엇이며,“상자와 수염”디자인은 어떻게 발전 했습니까?
많은 출처는 고전적인 "박스 플롯"디자인을 John Tukey 와 1970 년의 "도식 플롯"으로 거슬러 올라갑니다 . Edward Tufte의 박스 플롯 컷 다운 버전은 따라 잡지 못했지만 그 이후로 디자인은 상대적으로 정적으로 유지 된 것으로 보입니다. 바이올린 음모 -박스 음모의 더 유익한 변형이지만 인기는 낮습니다. 수염이 10 번째와 90 번째 백분위 수로 …

5
스트리밍 데이터 용 t-SNE 버전이 있습니까?
t-SNE 와 Barnes-Hut 근사에 대한 나의 이해는 모든 힘 상호 작용이 동시에 계산되고 각 점이 2d (또는 낮은 차원) 맵에서 조정될 수 있도록 모든 데이터 점이 필요하다는 것입니다. 스트리밍 데이터를 효율적으로 처리 할 수있는 t-sne 버전이 있습니까? 따라서 관측치가 한 번에 하나씩 도착하면 2d 맵에서 가장 좋은 위치를 찾아서 새 …

1
ggplot2에서 geom_point의 위치를 ​​어떻게 '닷지'할 수 있습니까?
잠김 . 이 질문과 주제는 주제가 다르지만 역사적 의미가 있기 때문에이 질문과 답변은 잠겨 있습니다. 현재 새로운 답변이나 상호 작용을받지 않습니다. R에서 ggplot2를 사용하여 다음과 같은 플롯을 만듭니다. 오류 표시 줄이 서로 겹치므로 정말 지저분 해 보입니다. 다른 인덱스에 대해 오차 막대를 어떻게 분리 할 수 ​​있습니까? position = "dodge"를 …


5
이산 변수와 연속 변수 간의 관계를 시각화하는 가장 좋은 방법은 무엇입니까?
다음 사이의 관계를 표시하는 가장 좋은 방법은 무엇입니까? 연속적이고 이산적인 변수 두 개의 이산 변수? 지금까지 산포도를 사용하여 연속 변수 간의 관계를 살펴 보았습니다. 그러나 불연속 변수의 경우 데이터 포인트가 특정 간격으로 누적됩니다. 따라서 최적의 선이 편향 될 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.