«data-visualization» 태그된 질문

데이터의 의미 있고 유용한 그래픽 표현 구성. (귀하의 질문이 특정 효과를 내기 위해 특정 소프트웨어를 얻는 방법에 관한 것이라면 여기서 다루지 않을 것입니다.)


6
시리즈에서 데이터 포인트 수를 줄이려면 어떻게합니까?
나는 10 년 이상 통계를 공부하지 않았으며 (그리고 기본 코스), 내 질문은 이해하기 어려울 것입니다. 어쨌든, 내가하고 싶은 일은 일련의 데이터 포인트 수를 줄이는 것입니다. x 축은 측정 시작 이후 밀리 초 수이며 y 축은 해당 지점의 판독 값입니다. 종종 수천 개의 데이터 포인트가 있지만 수백 개만 필요할 수도 있습니다. …

2
Simpson의 역설은 숨겨진 변수의 모든 역전 사례를 포함합니까?
다음은 심슨의 역설이 존재한다는 '그림으로 증명 된'것으로 제시된 많은 시각화에 대한 질문이며 아마도 용어에 대한 질문입니다. 심슨의 역설은 매우 간단 현상을 설명하고 (이유의 수치 예를 제공하는 것입니다 왜 이 깊고 재미 발생할 수에게). 역설은 한계 연관이 각 조건부 연관과 다른 방향을 갖는 2x2x2 우발 테이블 (Agresti, Categorical Data Analysis)이 존재한다는 …

1
R의 ARIMA 시계열에서 예측 된 값 플로팅
이 질문에는 하나 이상의 심각한 오해가있을 수 있지만 계산을 올바르게하는 것이 아니라 시계열을 배우는 데 중점을 둡니다. 시계열의 적용을 이해하려고 할 때, 데이터의 비추 세화로 미래의 가치를 예측할 수없는 것처럼 보입니다. 예를 들어 패키지의 gtemp시계열은 astsa다음과 같습니다. 예측 된 미래 가치를 표시 할 때 지난 수십 년간 상승 추세를 고려해야합니다. …

1
박스 플롯 노치와 Tukey-Kramer 간격
'R'의 상자 그림에서 "노치" 도움말 문서 ( 또는 원본 텍스트 )는 다음을 제공합니다. 두 플롯의 노치가 겹치지 않으면 두 중간 값이 다르다는 '강력한 증거'입니다 (Chambers et al, 1983, p. 62). 사용 된 계산에 대해서는 boxplot.stats를 참조하십시오. ' boxplot.stats '는 다음을 제공합니다. 노치 (요청 된 경우)는 +/- 1.58 IQR / sqrt …


1
PCA가 한 쌍의 큰 거리 만 보존한다는 것은 무엇을 의미합니까?
나는 현재 t-SNE 시각화 기술을 읽고 있으며 고차원 데이터를 시각화하기 위해 PCA (Principal Component Analysis)를 사용하는 단점 중 하나는 점 사이의 큰 쌍 거리를 유지한다는 것입니다. 고차원 공간에서 멀리 떨어져있는 의미 점은 저 차원 부분 공간에서도 멀리 떨어져 있지만 다른 모든 쌍방향 거리는 망칠 수 있습니다. 왜 그런지 이해하고 그래픽으로 …


3
"R"에서 그래프 클러스터링의 접근 및 예
'r'의 그래프 클러스터링을 사용하여 그래프에서 노드를 그룹화 / 병합하려고합니다. 여기 내 문제의 놀랍도록 장난감 변형이 있습니다. 두 개의 "클러스터"가 있습니다 클러스터를 연결하는 "브리지"가 있습니다 후보 네트워크는 다음과 같습니다. 연결 거리 "hopcount"를 보면 다음 행렬을 얻을 수 있습니다. mymatrix <- rbind( c(1,1,2,3,3,3,2,1,1,1), c(1,1,1,2,2,2,1,1,1,1), c(2,1,1,1,1,1,1,1,2,2), c(3,2,1,1,1,1,1,2,3,3), c(3,2,1,1,1,1,1,2,3,3), c(3,2,1,1,1,1,1,2,2,2), c(2,1,1,1,1,1,1,1,2,2), c(1,1,1,2,2,2,1,1,1,1), c(1,1,2,3,3,2,2,1,1,1), c(1,1,2,3,3,2,2,1,1,1)) …

2
항목 수와 비교하여 백분율을 시각화하는 방법
아래 차트를 시각화하고 치료를 시도한 환자의 수에 따라 치료 효과를 강조하는 가장 좋은 방법을 찾으려고합니다. 실제 페이지에 대한 링크는 다음과 같습니다. http://curetogether.com/cluster-headaches/treatments/ 효과를 강조하면서 치료법을 쉽게 비교하고 각각의 환자 수를 평가하는 가장 좋은 방법은 무엇입니까? 내 생각은 효과를 백분율로 표시하는 것이지만, 여전히 효과를 쉽게 비교하고 각 시도한 환자 수를 보여주는 …

3
큰 N, 이산 데이터 및 많은 변수가있을 때 산점도 행렬에서 정보를 추출하는 방법은 무엇입니까?
나는 유방암 데이터 세트를 가지고 놀고 있으며 모든 속성의 산점도를 만들어 어떤 클래스가 malignant(파란색)의 클래스 (파란색) 를 예측하는 데 가장 큰 영향을 미치는지 알 수 있습니다 benign. 행이 x 축을 나타내고 열이 y 축을 나타내는 것을 이해하지만이 산점도의 데이터 또는 속성에 대해 어떤 관찰을 할 수 있는지 알 수 없습니다. …

1
왼쪽으로 치우친 많은 분포 시각화
보여주고 싶은 왼쪽으로 치우친 / 꼬리 꼬리 분포가 있습니다. (로 표시된 세 개의 요소 (42 개)에 걸쳐 분포되어있다 A, B그리고 C아래에는). 또한 변동은 factor에 따라 줄어들고 있습니다 B. 내가 가진 문제는 분포가 결과의 규모 (비율 또는 배수 변화)에 따라 구별하기 어렵다는 것입니다. 데이터를 로깅하면 왼쪽 왜도가 지나치게 강조되어 더 많은 …

2
평균, sd, 최소 및 최대로 요약 통계를 플로팅합니까?
나는 경제학 배경을 가지고 있으며 일반적으로 학문에서 변수의 요약 통계가 표에보고됩니다. 그러나 나는 그것들을 꾸미고 싶습니다. 평균, 표준 편차, 최소 및 최대를 표시 할 수 있도록 상자 그림을 수정할 수 있었지만 상자 그림이 전통적으로 중앙값과 Q1 및 Q3을 표시하는 데 사용되므로 그렇게하고 싶지 않습니다. 모든 변수의 스케일이 다릅니다. 누군가이 요약 …

2
많은 변수에 대한 산점도 행렬 탐색
많은 매개 변수 (예 : 50-200)로 데이터 세트를 분석하고 변수 사이의 관계를 보는 데 관심이 있습니다 (예 : 2 변수 스 캐터 플롯 또는 2 차원 막대 그래프). 그러나이 수의 매개 변수의 경우 200x200 배열의 플롯을 그릴 수 없습니다 (인쇄하고 벽에 매달 지 않는 한). 반면, 상관 행렬 만 수행해도 …

3
로지스틱 회귀 분석에 대한 베이지안 적합도를 시각화하는 방법
베이지안 로지스틱 회귀 문제의 경우, 사후 예측 분포를 만들었습니다. 예측 분포에서 표본을 추출하고 내가 가진 각 관측치에 대해 (0,1)의 표본을 수천 개받습니다. 예를 들어 적합도를 시각화하는 것은 흥미롭지 않습니다. 이 그림은 10,000 개의 샘플 + 관측 된 데이텀 포인트를 보여줍니다 (왼쪽에서 빨간색 선을 만들 수 있음). 문제는이 음모가 거의 유익하지 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.