«descriptive-statistics» 태그된 질문

기술 통계량은 평균 및 표준 편차, 중앙값 및 사 분위수, 최대 값 및 최소값과 같은 샘플의 기능을 요약합니다. 여러 변수가있는 경우 상관 관계 및 크로스 탭이 포함될 수 있습니다. 박스 플롯, 히스토그램, 산점도 등의 시각적 디스플레이를 포함 할 수 있습니다.

12
값 스트림에 대한 기본 통계를 계산하는 명령 줄 도구 [닫기]
표준 입력에서 숫자의 흐름 (ASCII 형식)을 허용하고 최소, 최대, 평균, 중앙값, RMS, Quantile 등과 같은이 흐름에 대한 기본 설명 통계를 제공하는 명령 줄 도구가 있습니까? 명령 행 체인의 다음 명령으로 출력을 구문 분석 할 수 있습니다. 작업 환경은 Linux이지만 다른 옵션도 환영합니다.

3
산술 평균이 기하 평균에 매우 가까운 경우 데이터에 대해 무엇을 결론 낼 수 있습니까?
~ 0.1 %와 같이 서로 매우 근접한 기하 평균과 산술 평균에 대해 중요한 것이 있습니까? 그러한 데이터 세트에 대해 어떤 추측을 할 수 있습니까? 나는 데이터 세트를 분석하려고 노력했으며, 아이러니하게도 값이 매우 가깝다는 것을 알았습니다. 정확하지는 않지만 가깝습니다. 또한 산술 평균 기하학 평균 불평등의 빠른 온 전성 검사와 데이터 수집 …



4
기술 통계량을보고하는 요점은 무엇입니까?
로지스틱 회귀를 사용하여 데이터를 분석했지만 보고서에 기술 통계 부분이 있어야합니다. 나는 솔직히 이것의 요점을 보지 못했고 누군가 왜 그것이 필요한지 설명 할 수 있기를 바랐습니다. 예를 들어, 독립적 인 연속 변수 중 하나의 히스토그램을 플로팅하고 정규성을 보이거나 왜이 값이 보고서에 어떤 값을 추가 할 것인가를 보여주는 경우? 내 데이터는 취업에 …

1
상자와 수염이 같은 Anscombe와 유사한 데이터 세트 (평균 / 표준 / 중앙 / MAD / 최소 / 최대)
편집 :이 질문이 팽창함에 따라 요약 : 동일한 혼합 통계 (평균, 중간, 중간 범위 및 관련 분산 및 회귀)로 다른 의미 있고 해석 가능한 데이터 집합 찾기 Anscombe 중주 (참조 ? 고차원 데이터를 시각화 목적 ) 네의 유명한 예는 - (네에서 동일한 한계 평균 / 표준 편차, 데이터 집합 4 …

6
기술 통계량과 추론 통계의 차이점은 무엇입니까?
필자는 이해 통계가 데이터 샘플의 기능을 정량적으로 설명하는 반면 추론 통계는 샘플을 추출한 모집단에 대해 추론했다는 것을 이해했습니다. 그러나 통계적 추론 상태에 대한 Wikipedia 페이지는 다음과 같습니다. 대부분의 경우 통계적 추론은 임의의 형태의 무작위 표본 추출을 통해 관심있는 모집단에서 얻은 데이터를 사용하여 모집단에 대해 제안합니다. "대부분"은 내가이 개념들을 제대로 이해하지 …

4
"편견없는"은 무엇을 의미합니까?
"분산은 편향 추정기"라는 말의 의미는 무엇입니까? 간단한 공식을 통해 편향 추정치를 편향 추정치로 변환하는 것은 무엇을 의미합니까? 이 전환은 정확히 무엇을합니까? 또한이 전환의 실제적인 용도는 무엇입니까? 특정 종류의 통계를 사용할 때이 점수를 변환합니까?

2
로그 변환 후 표준 오류 계산
정규 분포를 따르는 임의의 숫자 세트를 고려하십시오. x <- rnorm(n=1000, mean=10) 우리는 평균에 대한 평균과 표준 오차를 알고 싶습니다. 그래서 우리는 다음을 수행합니다. se <- function(x) { sd(x)/sqrt(length(x)) } mean(x) # something near 10.0 units se(x) # something near 0.03 units 큰! 그러나 원래 분포가 정규 분포를 따른다는 것을 반드시 …

3
비정규 분포 표본에서 평균의 신뢰 구간을 어떻게 계산할 수 있습니까?
비정규 분포 표본에서 평균의 신뢰 구간을 어떻게 계산할 수 있습니까? 부트 스트랩 방법이 여기에서 일반적으로 사용된다는 것을 알고 있지만 다른 옵션을 사용할 수 있습니다. 비모수 적 옵션을 찾고있는 동안 누군가 파라 메트릭 솔루션이 유효하다고 확신 할 수 있다면 좋을 것입니다. 샘플 크기는> 400입니다. 누구나 R로 샘플을 줄 수 있다면 대단히 …

5
직관 (기하학적 또는 기타)
분산의 기본 정체성을 고려하십시오. Var(X)===E[(X−E[X])2]...E[X2]−(E[X])2Var(X)=E[(X−E[X])2]=...=E[X2]−(E[X])2 \begin{eqnarray} Var(X) &=& E[(X - E[X])^2]\\ &=& ...\\ &=& E[X^2] - (E[X])^2 \end{eqnarray} 중심 모멘트를 중심이 아닌 모멘트로 정의하는 간단한 대수적 조작입니다. 다른 상황에서 를 편리하게 조작 할 수 있습니다. 또한 평균을 계산 한 다음 분산을 계산하기 위해 두 패스가 아닌 단일 패스 데이터를 통해 …

4
상관 관계의 비 일시성 : 성별과 뇌의 크기, 뇌의 크기와 IQ 간의 상관 관계는 있지만 성별과 IQ의 상관 관계는 없음
블로그에서 다음 설명을 발견했으며 상관의 비 일시성에 대한 자세한 정보를 얻고 싶습니다. 다음과 같은 확실한 사실이 있습니다. 평균적으로 남성과 여성의 뇌량에는 차이가 있습니다 IQ와 뇌 크기 사이에는 상관 관계가 있습니다. 상관 관계는 0.33이므로 IQ 변동성의 10 %에 해당합니다. 이 구내 1과 2에서 논리적으로 다음과 같이 보입니다. 평균적으로 여성은 남성보다 IQ가 …

5
범주 형 또는 정 성적 변수와 함께 사용할 요약 통계는 무엇입니까?
간단히 말하면 요약 통계를 의미 할 때 평균, 사 분위수 범위, 분산, 표준 편차를 나타냅니다. 명목 및 순서를 모두 고려하여 범주 형 또는 정성형 일 변량을 요약 할 때 평균, 중앙값, 사 분위수 범위, 분산 및 표준 편차를 찾는 것이 합리적입니까? 그렇다면 연속 변수를 요약하는 것과 다른 점은 무엇입니까?


3
"통계 실험"과 "통계 모델"의 차이점은 무엇입니까?
나는 AW van der Vaart, asymptotic statistics (1998)를 따르고 있습니다. 그는 통계 실험과 통계 모델과는 다르다고 주장하지만, 둘 다 정의하지는 않습니다. 내 질문: (1) 통계 실험, (2) 통계 모델 및 (3) 통계 실험을 통계 모델과 구분할 수있는 핵심 요소는 무엇입니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.