«data-visualization» 태그된 질문

데이터의 의미 있고 유용한 그래픽 표현 구성. (귀하의 질문이 특정 효과를 내기 위해 특정 소프트웨어를 얻는 방법에 관한 것이라면 여기서 다루지 않을 것입니다.)


3
데이터가 포함 된 실용적인 PCA 튜토리얼
인터넷에서 PCA 튜토리얼을 검색하면 수천 개의 결과 (동영상)가 제공됩니다. 많은 튜토리얼이 매우 좋습니다. 그러나 데모에 사용할 수있는 일부 데이터 세트를 사용하여 PCA를 설명하는 실용적인 예를 찾을 수 없습니다. PCA 분석 전후에 플롯하기 쉬운 작은 데이터 세트 (10000s의 데이터가 아닌 10000s의 라인이 아님)를 제공하는 자습서가 필요하며 차이 / 결과를 명확하게 보여줄 …

1
R의 타임 라인에 이벤트 플로팅
시작 및 중지 시간의 데이터 프레임을 다음과 같은 타임 라인 플롯으로 변환 할 수있는 R 용 플롯 라이브러리가 있습니까? Y 축은 동시성으로 스택되지만 항상 동시성을 나타내는 것은 아닙니다 (중간 간격 참조). 각 회색 상자는 데이터 프레임의 행인 이벤트입니다. 데이터 프레임에는 시작 시간과 중지 시간의 두 열이 있습니다.

3
R로 와플 차트를 만드는 방법?
잠김 . 이 질문과 주제는 주제가 다르지만 역사적으로 중요하기 때문에이 질문과 답변은 잠겨 있습니다. 현재 새로운 답변이나 상호 작용을받지 않습니다. R에서 원형 차트를 사용하는 대신 와플 차트를 플로팅하려면 어떻게해야합니까? help.search("waffle") No help files found with alias or concept or title matching ‘waffle’ using fuzzy matching. 내가 찾은 가장 가까운 인터넷 …

1
파이썬에서 scree plot을 그리는 방법은 무엇입니까? [닫은]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 작년에 문을 닫았 습니다 . 행렬에서 특이 벡터 분해를 사용하고 U, S 및 Vt 행렬을 얻고 있습니다. 이 시점에서 유지할 차원 수에 대한 임계 값을 선택하려고합니다. 나는 scree …

1
대장균 발생 분석에 대해 통계학자는 어떤 질문을합니까?
당신은 독일에서 최근의 enterohaemorrhagic E. coli ( EHEC ) 발생에 대해 들었을 것 입니다 . 통계학자는 EHEC 분석에 대해 어떤 질문을합니까? 기자 / 공무원 ↔ 비전문가 사이의 Q + A를 생각하고 있습니다. Diplom / Master 's 학위를 가진 교사와 엔지니어는 있지만 통계는 상당히 불분명합니다. (그림, 다양한 EHEC 변형률 및 다양한 …

2
2D로 다차원 데이터 (LSI) 시각화
나는 문서 간의 유사성을 찾기 위해 잠재 의미 색인을 사용하고 있습니다 ( 감사, JMS를! ) 차원 축소 후에 문서를 클러스터로 그룹화하기 위해 k- 평균 군집화를 시도했지만 매우 효과적입니다. 그러나 조금 더 나아가서 두 노드 사이의 거리가 유사성에 반비례하는 노드 세트로 문서를 시각화하고 싶습니다 (매우 유사한 노드는 서로 가깝습니다). 내 데이터가 …

1
중앙값 및 그래픽 표현으로보고하는 데 오류가 있습니까?
파라 메트릭 분산 분석 및 t- 테스트에서 비 파라 메트릭 Kruskal-Wallis 테스트 및 Mann-Whitneys에 이르기까지 랭크 변환 된 2-way ANOVA와 바이너리가 포함 된 GzLM, 포아송 및 비례 데이터. 이제 결과를 모두 작성하면서 모든 내용을보고해야합니다. 비율 데이터에 대한 비대칭 신뢰 구간을보고하는 방법을 이미 여기에 요청 했습니다 . 표준 편차, 표준 오류 …

2
신뢰 구간이있는 교호 작용 그림을 그리는 방법은 무엇입니까?
내 시도 : 에 신뢰 구간을 얻을 수 없습니다 interaction.plot() 반면에 plotmeans()'gplot'패키지는 두 개의 그래프를 표시하지 않습니다. 또한 plotmeans()기본적으로 축이 다르기 때문에 두 개의 그래프를 다른 그래프 위에 부과 할 수 없었습니다 . plotCI()'gplot'패키지에서 사용 하고 두 개의 그래프를 겹쳐서 성공 했지만 여전히 축의 일치가 완벽하지 않았습니다. 신뢰 구간을 사용하여 …

4
Y와 X의 상관 관계 덕분에 설명 된 분산에서 이득을 나타내는 방법은 무엇입니까?
첫해 학생들과 간단한 선형 상관 관계를 (시각적으로) 설명하는 방법을 찾고 있습니다. 시각화하는 고전적인 방법은 직선 회귀선이있는 Y ~ X 산점도를 제공하는 것입니다. 최근에, 나는 플롯 3에 더 많은 이미지를 추가 하여이 유형의 그래픽을 확장한다는 아이디어를 얻었습니다 .y ~ 1, y ~ x, resid (y ~ x) ~ x의 마지막 잔차 …

2
R에서 정렬 된 범주 형 데이터 간의 상관 관계를 시각적으로 신속하게 평가합니까?
설문 조사에서 다른 질문에 대한 답변 사이의 상관 관계를 찾고 있습니다 ( "음, 11 번 질문에 대한 답변이 78 번 질문에 대한 답변과 관련이 있는지 살펴 보겠습니다"). 모든 답변은 범주 형 (대부분 "매우 불행"에서 "매우 행복"까지)이지만 일부 답변에는 다른 답변이 있습니다. 대부분은 서수로 간주 될 수 있으므로이 경우를 고려해 보겠습니다. …

1
R / mgcv : te () 및 ti () 텐서 제품이 다른 표면을 생성하는 이유는 무엇입니까?
mgcv에 대한 패키지는 R텐서 제품의 상호 작용을 피팅에 대한 두 가지 기능이 있습니다 : te()와 ti(). 나는 둘 사이의 기본 노동 분열을 이해한다 (비선형 상호 작용에 적합하고이 상호 작용을 주요 효과와 상호 작용으로 분해). 내가 이해할 수없는 것은 왜 te(x1, x2)와 ti(x1) + ti(x2) + ti(x1, x2)(약간) 다른 결과가 발생할 …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
노치 상자 그림을 해석하는 방법
일부 EDA를 수행하는 동안 요인의 두 수준 간 차이를 설명하기 위해 상자 그림을 사용하기로 결정했습니다. ggplot 이 박스 플롯을 렌더링하는 방식 은 만족 스럽지만 약간 단순합니다 (아래의 첫 번째 플롯). 박스 플롯의 특성을 연구하는 동안 노치를 실험하기 시작했습니다. 나는 노치가 중앙값 주위에 CI를 표시한다는 것을 이해하고 두 상자의 노치가 겹치지 …

3
누적 / 누적 플롯 (또는 "로렌츠 곡선 시각화")
나는 그런 음모가 무엇인지 모르므 로이 질문에 바보 같은 제목을주었습니다. 다음과 같이 정렬 된 데이터 세트가 있다고 가정 해 봅시다. 4253 4262 4270 4383 4394 4476 4635 ... 각 숫자는 특정 사용자가 웹 사이트에 기여한 게시물의 양에 해당합니다. 여기에 정의 된 "참여 불평등"현상을 경험적으로 조사하고 있습니다 . 이해하기 쉽도록 독자가 …

1
불확실성 집계 방법을 시각화하는 데 유용한 그래픽 방법은 무엇입니까?
불확실성이 축적되는 일련의 시스템이 있습니다. 이것들은 항상 순전히 부가적인 것은 아니며 때로는 그렇지 않은 경우도 있습니다. 팬 차트, 신뢰 구간이있는 막대 차트 및 단일 항목 통신을위한 상자 그림을 사용하는 데 성공했습니다. 그러나 어떻게 불확실성이 축적되고 결합되는지 보여줄 수있을뿐만 아니라 불확실성이있는 데이터 포인트를 보여줄 수 있습니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.