통계 및 빅 데이터 data-visualization

3

PowerPoint와 함께 사용할 수있는 최고의 오픈 소스 데이터 시각화 소프트웨어

최고의 오픈 소스 데이터 시각화 소프트웨어는 무엇입니까? 다음이 필요합니다. Microsoft Excel에서 데이터를 가져올 수 있습니다 (Oracle 데이터베이스에서 데이터를 가져 오는 것도 좋지만 필수는 아닙니다). 소프트웨어로 생성 된 차트를 Microsoft PowerPoint로 내보낼 수 있습니다 (복사하여 붙여 넣기를해도 괜찮습니다). 오픈 소스 및 사용하기 쉽습니다.

14 data-visualization excel software open-source

3

다항 회귀 분석의 신뢰 구간 이해

아래 그래프에 표시된 결과를 이해하려고합니다. 일반적으로 Excel을 사용하고 선형 회귀선을 얻는 경향이 있지만 아래의 경우 R을 사용하고 다음 명령으로 다항식 회귀를 얻습니다. ggplot(visual1, aes(ISSUE_DATE,COUNTED)) + geom_point() + geom_smooth() 그래서 내 질문은 이것으로 요약됩니다. 파란색 회귀선 주위의 회색 영역 (화살표 # 1)은 무엇입니까? 다항식 회귀 분석의 표준 편차입니까? 회색 영역 (화살표 …

14 r regression data-visualization outliers

5

QQ 플롯 중심 근처의 불필요한 점 제거

R에서 약 120 만 포인트의 두 데이터 세트로 QQ 플롯을 플로팅하려고합니다 (qqplot 사용 및 ggplot2에 데이터 공급). 계산은 쉽지만 결과 그래프는로드가 너무 느립니다. 점이 너무 많기 때문입니다. 점 수를 10000으로 줄이기 위해 선형 근사법을 시도했지만 (데이터 세트 중 하나가 다른 것보다 큰 경우 qqplot 함수가 수행하는 작업입니다) 꼬리의 세부 사항을 …

14 r data-visualization qq-plot

3

비교를 위해 바이올린 플롯을 스케일링하는 방법은 무엇입니까?

나는 바이올린 음모를 그리려고 노력하고 있으며 그룹별로 스케일링을위한 모범 사례가 있는지 궁금합니다. 다음은 R mtcars데이터 세트를 사용하여 시도한 세 가지 옵션 입니다 (1973의 모터 트렌드 자동차, 여기 참조 ). 동일한 폭 원래 종이 * 가하는 것과 R 이하 vioplot는 것 ( 예 :) 인 것 같습니다 . 모양을 비교하는 데 …

14 distributions data-visualization nonparametric

3

두 개의 히스토그램을 같은 규모로 배치하는 가장 좋은 방법은 무엇입니까?

모양, 크기 및 이동을 쉽게 볼 수있는 방식으로 자세하게 비교하고자하는 두 개의 분포가 있다고 가정 해 봅시다. 이를 수행하는 한 가지 좋은 방법은 각 분포에 대한 히스토그램을 플로팅하여 동일한 X 스케일에 배치하고 다른 하나 아래에 쌓이는 것입니다. 이 작업을 수행 할 때 비닝을 어떻게 수행해야합니까? 아래 그림 1에서와 같이 하나의 …

14 data-visualization histogram pdf binning

4

동적 (/ 대화식) 통계 시각화 사용 (/ 만들기) 학습을위한 리소스

대화 형 데이터 시각화 (확대 / 축소, 포인팅, 브러싱, 포인트 매핑 등)에 대해 조금 더 배우고 싶습니다. 나는 환영합니다 : 통계적 탐색에 이러한 방법 을 사용하는 방법에 대한 자습서 / 가이드 / 책 (?) / 비디오 유익하고 흥미로운 대화 형 데이터-비즈 패키지 (R 및 외부)를 위한 포인터 볼 롤링을 시작하기 …

14 data-visualization interactive-visualization

1

R에서 음모와 같은 연령 피라미드를 만드는 방법은 무엇입니까?

잠김 . 이 질문과 주제는 주제가 다르지만 역사적으로 중요하기 때문에이 질문과 답변은 잠겨 있습니다. 현재 새로운 답변이나 상호 작용을받지 않습니다. Age Pyramid는 다음과 같습니다. 비슷한 범주를 가진 2 개의 막대 그래프 (히스토그램이 아님)를 세로로 회전하고 피라미드에서와 같이 양쪽으로 확장하고 싶습니다. R에서 이것을 수행하는 간단한 방법입니까? 각 막대의 색상을 제어하는 것도 …

14 r data-visualization

4

후속 조치 : ANOVA 사이의 혼합 된 플롯에서 추정 된 SE 또는 실제 SE?

나는 현재 논문을 완성하고 있으며 어제 부터이 질문에 우연히 빠져 나에게 같은 질문을 던졌다. 데이터 또는 실제 분산 분석에서 추정 된 실제 오차를 그래프에 제공하는 것이 더 낫습니까? 어제의 질문은 다소 구체적이지 않았고 내 것이 매우 구체적이기 때문에이 후속 질문을 제기하는 것이 적절하다고 생각했습니다. 세부 사항 : 나는 두 그룹 …

14 data-visualization anova mixed-model standard-error

9

클러스터링을위한 시각화 소프트웨어

잠김 . 이 질문과 주제는 주제가 다르지만 역사적으로 중요하기 때문에이 질문과 답변은 잠겨 있습니다. 현재 새로운 답변이나 상호 작용을받지 않습니다. ~ 22000 포인트를 클러스터하고 싶습니다. 많은 클러스터링 알고리즘은 고품질 초기 추측으로 더 잘 작동합니다. 거친 데이터 형태에 대한 좋은 아이디어를 제공 할 수있는 도구는 무엇입니까? 나는 자신의 거리 측정법을 선택할 …

14 data-visualization clustering software

4

Structural Equation Modeling에는 어떤 그래픽 기법이 사용됩니까?

구조 방정식 모델링에 특히 그래픽 기법이 적용 가능하거나 더 적용 가능한지 궁금합니다. 이것이 공분산 분석을위한 탐색 도구 또는 SEM 모델 평가를위한 그래픽 진단의 범주로 분류 될 수 있습니다. (실제로 경로 / 그래프 다이어그램을 생각하지 않습니다.)

14 sem data-visualization

1

캐럿 glmnet vs cv.glmnet

glmnetwithin caret을 사용하여 최적의 람다를 검색 cv.glmnet하고 동일한 작업을 수행하는 것을 비교하는 데 많은 혼란이있는 것 같습니다 . 다음과 같은 많은 질문이 제기되었습니다. 분류 모델 train.glmnet 대 cv.glmnet? 캐럿과 함께 glmnet을 사용하는 올바른 방법은 무엇입니까? `caret`를 사용한 교차 유효성 검사`glmnet` 그러나 질문의 재현 가능성으로 인한 답변이 없습니다. 첫 번째 질문에 …

14 r caret glmnet machine-learning neural-networks maximum softmax probability distributions mathematical-statistics random-variable cdf statistical-significance variance expected-value ratio sample-size reliability tolerance-interval wilcoxon-signed-rank self-study variance sampling mean machine-learning svm libsvm self-study sampling ranks data-visualization histogram machine-learning classification normal-distribution mathematical-statistics maximum-likelihood mixture predictive-models prediction seasonality

1

GAM vs LOESS vs 스플라인

컨텍스트 : 매개 변수로 표시되지 않는 산점도에 선을 그리려면에서를 사용 geom_smooth()하고 ggplot있습니다 R. 자동으로 반환 geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.내가 GAM이 일반화 된 첨가제 모델을 의미 …

14 r gam splines loess r data-visualization boxplot mathematical-statistics theory sufficient-statistics machine-learning classification correlation svm feature-selection probability stochastic-processes machine-learning reinforcement-learning

4

분포를 보여주기 위해 세로선을 사용하는이 그림의 이름은 무엇입니까?

수직선이 범위 내 일부 표본의 분포를 나타내는이 매우 간단한 음모의 공식 명칭이 있습니까?

14 data-visualization

4

상자 그림에서 히스토그램이 제공하지 않는 정보는 무엇입니까?

히스토그램은 변수의 분포를 잘 보여줍니다. 상자 그림은 같은 일을 시도하지만이 변수의 분포에 대한 그림을 제공하지는 않습니다. 사람들이 왜 상자 그림을 사용하는지 이해하지 못합니다. 히스토그램은 모든면에서 더 좋습니다. 둘 다 사용하는 이유가 있습니까? 박스 플롯이 제공하는 유일한 것은 : 이상치입니다! 어떤 관측치가 특이 치 일지 알려줍니다.

13 data-visualization histogram boxplot

4

작은 샘플 그래프

작업을 완료하기 위해 14 개의 개별 시간으로 구성된 작은 데이터 세트가 있습니다. 그러나 데이터를 그래프로 표시하는 데 사용할 적절한 그래프를 찾는 데 어려움이 있습니다. 샘플이 더 큰 경우 상자 그림이나 히스토그램을 사용하지만 샘플이 너무 작은 경우이 경우에 사용하는 것이 적합한 지 확실하지 않습니다. 업데이트 : 시간은 5.2,3.9,5.6,4.2,3.8,4.1,6.0,5.6,4.4,4.5,4.9,4.5,4.9,4.2입니다.

13 data-visualization descriptive-statistics small-sample

«data-visualization» 태그된 질문