«data-visualization» 태그된 질문

데이터의 의미 있고 유용한 그래픽 표현 구성. (귀하의 질문이 특정 효과를 내기 위해 특정 소프트웨어를 얻는 방법에 관한 것이라면 여기서 다루지 않을 것입니다.)

3
PowerPoint와 함께 사용할 수있는 최고의 오픈 소스 데이터 시각화 소프트웨어
최고의 오픈 소스 데이터 시각화 소프트웨어는 무엇입니까? 다음이 필요합니다. Microsoft Excel에서 데이터를 가져올 수 있습니다 (Oracle 데이터베이스에서 데이터를 가져 오는 것도 좋지만 필수는 아닙니다). 소프트웨어로 생성 된 차트를 Microsoft PowerPoint로 내보낼 수 있습니다 (복사하여 붙여 넣기를해도 괜찮습니다). 오픈 소스 및 사용하기 쉽습니다.

3
다항 회귀 분석의 신뢰 구간 이해
아래 그래프에 표시된 결과를 이해하려고합니다. 일반적으로 Excel을 사용하고 선형 회귀선을 얻는 경향이 있지만 아래의 경우 R을 사용하고 다음 명령으로 다항식 회귀를 얻습니다. ggplot(visual1, aes(ISSUE_DATE,COUNTED)) + geom_point() + geom_smooth() 그래서 내 질문은 이것으로 요약됩니다. 파란색 회귀선 주위의 회색 영역 (화살표 # 1)은 무엇입니까? 다항식 회귀 분석의 표준 편차입니까? 회색 영역 (화살표 …

5
QQ 플롯 중심 근처의 불필요한 점 제거
R에서 약 120 만 포인트의 두 데이터 세트로 QQ 플롯을 플로팅하려고합니다 (qqplot 사용 및 ggplot2에 데이터 공급). 계산은 쉽지만 결과 그래프는로드가 너무 느립니다. 점이 너무 많기 때문입니다. 점 수를 10000으로 줄이기 위해 선형 근사법을 시도했지만 (데이터 세트 중 하나가 다른 것보다 큰 경우 qqplot 함수가 수행하는 작업입니다) 꼬리의 세부 사항을 …

3
비교를 위해 바이올린 플롯을 스케일링하는 방법은 무엇입니까?
나는 바이올린 음모를 그리려고 노력하고 있으며 그룹별로 스케일링을위한 모범 사례가 있는지 궁금합니다. 다음은 R mtcars데이터 세트를 사용하여 시도한 세 가지 옵션 입니다 (1973의 모터 트렌드 자동차, 여기 참조 ). 동일한 폭 원래 종이 * 가하는 것과 R 이하 vioplot는 것 ( 예 :) 인 것 같습니다 . 모양을 비교하는 데 …

3
두 개의 히스토그램을 같은 규모로 배치하는 가장 좋은 방법은 무엇입니까?
모양, 크기 및 이동을 쉽게 볼 수있는 방식으로 자세하게 비교하고자하는 두 개의 분포가 있다고 가정 해 봅시다. 이를 수행하는 한 가지 좋은 방법은 각 분포에 대한 히스토그램을 플로팅하여 동일한 X 스케일에 배치하고 다른 하나 아래에 쌓이는 것입니다. 이 작업을 수행 할 때 비닝을 어떻게 수행해야합니까? 아래 그림 1에서와 같이 하나의 …

4
동적 (/ 대화식) 통계 시각화 사용 (/ 만들기) 학습을위한 리소스
대화 형 데이터 시각화 (확대 / 축소, 포인팅, 브러싱, 포인트 매핑 등)에 대해 조금 더 배우고 싶습니다. 나는 환영합니다 : 통계적 탐색에 이러한 방법 을 사용하는 방법에 대한 자습서 / 가이드 / 책 (?) / 비디오 유익하고 흥미로운 대화 형 데이터-비즈 패키지 (R 및 외부)를 위한 포인터 볼 롤링을 시작하기 …

1
R에서 음모와 같은 연령 피라미드를 만드는 방법은 무엇입니까?
잠김 . 이 질문과 주제는 주제가 다르지만 역사적으로 중요하기 때문에이 질문과 답변은 잠겨 있습니다. 현재 새로운 답변이나 상호 작용을받지 않습니다. Age Pyramid는 다음과 같습니다. 비슷한 범주를 가진 2 개의 막대 그래프 (히스토그램이 아님)를 세로로 회전하고 피라미드에서와 같이 양쪽으로 확장하고 싶습니다. R에서 이것을 수행하는 간단한 방법입니까? 각 막대의 색상을 제어하는 ​​것도 …

4
후속 조치 : ANOVA 사이의 혼합 된 플롯에서 추정 된 SE 또는 실제 SE?
나는 현재 논문을 완성하고 있으며 어제 부터이 질문에 우연히 빠져 나에게 같은 질문을 던졌다. 데이터 또는 실제 분산 분석에서 추정 된 실제 오차를 그래프에 제공하는 것이 더 낫습니까? 어제의 질문은 다소 구체적이지 않았고 내 것이 매우 구체적이기 때문에이 후속 질문을 제기하는 것이 적절하다고 생각했습니다. 세부 사항 : 나는 두 그룹 …

9
클러스터링을위한 시각화 소프트웨어
잠김 . 이 질문과 주제는 주제가 다르지만 역사적으로 중요하기 때문에이 질문과 답변은 잠겨 있습니다. 현재 새로운 답변이나 상호 작용을받지 않습니다. ~ 22000 포인트를 클러스터하고 싶습니다. 많은 클러스터링 알고리즘은 고품질 초기 추측으로 더 잘 작동합니다. 거친 데이터 형태에 대한 좋은 아이디어를 제공 할 수있는 도구는 무엇입니까? 나는 자신의 거리 측정법을 선택할 …


1
캐럿 glmnet vs cv.glmnet
glmnetwithin caret을 사용하여 최적의 람다를 검색 cv.glmnet하고 동일한 작업을 수행하는 것을 비교하는 데 많은 혼란이있는 것 같습니다 . 다음과 같은 많은 질문이 제기되었습니다. 분류 모델 train.glmnet 대 cv.glmnet? 캐럿과 함께 glmnet을 사용하는 올바른 방법은 무엇입니까? `caret`를 사용한 교차 유효성 검사`glmnet` 그러나 질문의 ​​재현 가능성으로 인한 답변이 없습니다. 첫 번째 질문에 …

1
GAM vs LOESS vs 스플라인
컨텍스트 : 매개 변수로 표시되지 않는 산점도에 선을 그리려면에서를 사용 geom_smooth()하고 ggplot있습니다 R. 자동으로 반환 geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.내가 GAM이 일반화 된 첨가제 모델을 의미 …


4
상자 그림에서 히스토그램이 제공하지 않는 정보는 무엇입니까?
히스토그램은 변수의 분포를 잘 보여줍니다. 상자 그림은 같은 일을 시도하지만이 변수의 분포에 대한 그림을 제공하지는 않습니다. 사람들이 왜 상자 그림을 사용하는지 이해하지 못합니다. 히스토그램은 모든면에서 더 좋습니다. 둘 다 사용하는 이유가 있습니까? 박스 플롯이 제공하는 유일한 것은 : 이상치입니다! 어떤 관측치가 특이 치 일지 알려줍니다.

4
작은 샘플 그래프
작업을 완료하기 위해 14 개의 개별 시간으로 구성된 작은 데이터 세트가 있습니다. 그러나 데이터를 그래프로 표시하는 데 사용할 적절한 그래프를 찾는 데 어려움이 있습니다. 샘플이 더 큰 경우 상자 그림이나 히스토그램을 사용하지만 샘플이 너무 작은 경우이 경우에 사용하는 것이 적합한 지 확실하지 않습니다. 업데이트 : 시간은 5.2,3.9,5.6,4.2,3.8,4.1,6.0,5.6,4.4,4.5,4.9,4.5,4.9,4.2입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.