통계 및 빅 데이터 data-visualization

2

빈 플롯 차트를 어떻게 해석하고 생성합니까? 다음은 Walkes et al. 2010 년 . 어떤 종류의 데이터가 가장 유용합니까? (출처 : biomedcentral.com )

11 data-visualization boxplot

3

인터넷에서 PCA 튜토리얼을 검색하면 수천 개의 결과 (동영상)가 제공됩니다. 많은 튜토리얼이 매우 좋습니다. 그러나 데모에 사용할 수있는 일부 데이터 세트를 사용하여 PCA를 설명하는 실용적인 예를 찾을 수 없습니다. PCA 분석 전후에 플롯하기 쉬운 작은 데이터 세트 (10000s의 데이터가 아닌 10000s의 라인이 아님)를 제공하는 자습서가 필요하며 차이 / 결과를 명확하게 보여줄 …

11 data-visualization dataset pca data-mining

1

R의 타임 라인에 이벤트 플로팅

시작 및 중지 시간의 데이터 프레임을 다음과 같은 타임 라인 플롯으로 변환 할 수있는 R 용 플롯 라이브러리가 있습니까? Y 축은 동시성으로 스택되지만 항상 동시성을 나타내는 것은 아닙니다 (중간 간격 참조). 각 회색 상자는 데이터 프레임의 행인 이벤트입니다. 데이터 프레임에는 시작 시간과 중지 시간의 두 열이 있습니다.

11 r data-visualization

3

R로 와플 차트를 만드는 방법?

잠김 . 이 질문과 주제는 주제가 다르지만 역사적으로 중요하기 때문에이 질문과 답변은 잠겨 있습니다. 현재 새로운 답변이나 상호 작용을받지 않습니다. R에서 원형 차트를 사용하는 대신 와플 차트를 플로팅하려면 어떻게해야합니까? help.search("waffle") No help files found with alias or concept or title matching ‘waffle’ using fuzzy matching. 내가 찾은 가장 가까운 인터넷 …

11 r data-visualization

1

파이썬에서 scree plot을 그리는 방법은 무엇입니까? [닫은]

닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 작년에 문을 닫았 습니다 . 행렬에서 특이 벡터 분해를 사용하고 U, S 및 Vt 행렬을 얻고 있습니다. 이 시점에서 유지할 차원 수에 대한 임계 값을 선택하려고합니다. 나는 scree …

11 data-visualization python svd

1

대장균 발생 분석에 대해 통계학자는 어떤 질문을합니까?

당신은 독일에서 최근의 enterohaemorrhagic E. coli ( EHEC ) 발생에 대해 들었을 것 입니다 . 통계학자는 EHEC 분석에 대해 어떤 질문을합니까? 기자 / 공무원 ↔ 비전문가 사이의 Q + A를 생각하고 있습니다. Diplom / Master 's 학위를 가진 교사와 엔지니어는 있지만 통계는 상당히 불분명합니다. (그림, 다양한 EHEC 변형률 및 다양한 …

11 data-visualization teaching

2

2D로 다차원 데이터 (LSI) 시각화

나는 문서 간의 유사성을 찾기 위해 잠재 의미 색인을 사용하고 있습니다 ( 감사, JMS를! ) 차원 축소 후에 문서를 클러스터로 그룹화하기 위해 k- 평균 군집화를 시도했지만 매우 효과적입니다. 그러나 조금 더 나아가서 두 노드 사이의 거리가 유사성에 반비례하는 노드 세트로 문서를 시각화하고 싶습니다 (매우 유사한 노드는 서로 가깝습니다). 내 데이터가 …

11 data-visualization clustering python multidimensional-scaling

1

중앙값 및 그래픽 표현으로보고하는 데 오류가 있습니까?

파라 메트릭 분산 분석 및 t- 테스트에서 비 파라 메트릭 Kruskal-Wallis 테스트 및 Mann-Whitneys에 이르기까지 랭크 변환 된 2-way ANOVA와 바이너리가 포함 된 GzLM, 포아송 및 비례 데이터. 이제 결과를 모두 작성하면서 모든 내용을보고해야합니다. 비율 데이터에 대한 비대칭 신뢰 구간을보고하는 방법을 이미 여기에 요청 했습니다 . 표준 편차, 표준 오류 …

11 data-visualization median error

2

신뢰 구간이있는 교호 작용 그림을 그리는 방법은 무엇입니까?

내 시도 : 에 신뢰 구간을 얻을 수 없습니다 interaction.plot() 반면에 plotmeans()'gplot'패키지는 두 개의 그래프를 표시하지 않습니다. 또한 plotmeans()기본적으로 축이 다르기 때문에 두 개의 그래프를 다른 그래프 위에 부과 할 수 없었습니다 . plotCI()'gplot'패키지에서 사용 하고 두 개의 그래프를 겹쳐서 성공 했지만 여전히 축의 일치가 완벽하지 않았습니다. 신뢰 구간을 사용하여 …

11 r data-visualization confidence-interval interaction

4

Y와 X의 상관 관계 덕분에 설명 된 분산에서 이득을 나타내는 방법은 무엇입니까?

첫해 학생들과 간단한 선형 상관 관계를 (시각적으로) 설명하는 방법을 찾고 있습니다. 시각화하는 고전적인 방법은 직선 회귀선이있는 Y ~ X 산점도를 제공하는 것입니다. 최근에, 나는 플롯 3에 더 많은 이미지를 추가 하여이 유형의 그래픽을 확장한다는 아이디어를 얻었습니다 .y ~ 1, y ~ x, resid (y ~ x) ~ x의 마지막 잔차 …

11 r data-visualization regression correlation

2

R에서 정렬 된 범주 형 데이터 간의 상관 관계를 시각적으로 신속하게 평가합니까?

설문 조사에서 다른 질문에 대한 답변 사이의 상관 관계를 찾고 있습니다 ( "음, 11 번 질문에 대한 답변이 78 번 질문에 대한 답변과 관련이 있는지 살펴 보겠습니다"). 모든 답변은 범주 형 (대부분 "매우 불행"에서 "매우 행복"까지)이지만 일부 답변에는 다른 답변이 있습니다. 대부분은 서수로 간주 될 수 있으므로이 경우를 고려해 보겠습니다. …

11 r correlation categorical-data data-visualization

1

R / mgcv : te () 및 ti () 텐서 제품이 다른 표면을 생성하는 이유는 무엇입니까?

mgcv에 대한 패키지는 R텐서 제품의 상호 작용을 피팅에 대한 두 가지 기능이 있습니다 : te()와 ti(). 나는 둘 사이의 기본 노동 분열을 이해한다 (비선형 상호 작용에 적합하고이 상호 작용을 주요 효과와 상호 작용으로 분해). 내가 이해할 수없는 것은 왜 te(x1, x2)와 ti(x1) + ti(x2) + ti(x1, x2)(약간) 다른 결과가 발생할 …

11 r gam mgcv conditional-probability mixed-model references bayesian estimation conditional-probability machine-learning optimization gradient-descent r hypothesis-testing wilcoxon-mann-whitney time-series bayesian inference change-point time-series anova repeated-measures statistical-significance bayesian contingency-tables regression prediction quantiles classification auc k-means scikit-learn regression spatial circular-statistics t-test effect-size cohens-d r cross-validation feature-selection caret machine-learning modeling python optimization frequentist correlation sample-size normalization group-differences heteroscedasticity independence generalized-least-squares lme4-nlme references mcmc metropolis-hastings optimization r logistic feature-selection separation clustering k-means normal-distribution gaussian-mixture kullback-leibler java spark-mllib data-visualization categorical-data barplot hypothesis-testing statistical-significance chi-squared type-i-and-ii-errors pca scikit-learn conditional-expectation statistical-significance meta-analysis intuition r time-series multivariate-analysis garch machine-learning classification data-mining missing-data cart regression cross-validation matrix-decomposition categorical-data repeated-measures chi-squared assumptions contingency-tables prediction binary-data trend test-for-trend matrix-inverse anova categorical-data regression-coefficients standard-error r distributions exponential interarrival-time copula log-likelihood time-series forecasting prediction-interval mean standard-error meta-analysis meta-regression network-meta-analysis systematic-review normal-distribution multiple-regression generalized-linear-model poisson-distribution poisson-regression r sas cohens-kappa

1

노치 상자 그림을 해석하는 방법

일부 EDA를 수행하는 동안 요인의 두 수준 간 차이를 설명하기 위해 상자 그림을 사용하기로 결정했습니다. ggplot 이 박스 플롯을 렌더링하는 방식 은 만족 스럽지만 약간 단순합니다 (아래의 첫 번째 플롯). 박스 플롯의 특성을 연구하는 동안 노치를 실험하기 시작했습니다. 나는 노치가 중앙값 주위에 CI를 표시한다는 것을 이해하고 두 상자의 노치가 겹치지 …

11 data-visualization ggplot2 eda

3

누적 / 누적 플롯 (또는 "로렌츠 곡선 시각화")

나는 그런 음모가 무엇인지 모르므 로이 질문에 바보 같은 제목을주었습니다. 다음과 같이 정렬 된 데이터 세트가 있다고 가정 해 봅시다. 4253 4262 4270 4383 4394 4476 4635 ... 각 숫자는 특정 사용자가 웹 사이트에 기여한 게시물의 양에 해당합니다. 여기에 정의 된 "참여 불평등"현상을 경험적으로 조사하고 있습니다 . 이해하기 쉽도록 독자가 …

11 r distributions data-visualization

1

불확실성 집계 방법을 시각화하는 데 유용한 그래픽 방법은 무엇입니까?

불확실성이 축적되는 일련의 시스템이 있습니다. 이것들은 항상 순전히 부가적인 것은 아니며 때로는 그렇지 않은 경우도 있습니다. 팬 차트, 신뢰 구간이있는 막대 차트 및 단일 항목 통신을위한 상자 그림을 사용하는 데 성공했습니다. 그러나 어떻게 불확실성이 축적되고 결합되는지 보여줄 수있을뿐만 아니라 불확실성이있는 데이터 포인트를 보여줄 수 있습니까?

11 data-visualization confidence-interval uncertainty

«data-visualization» 태그된 질문