통계 및 빅 데이터 descriptive-statistics

12

표준 입력에서 숫자의 흐름 (ASCII 형식)을 허용하고 최소, 최대, 평균, 중앙값, RMS, Quantile 등과 같은이 흐름에 대한 기본 설명 통계를 제공하는 명령 줄 도구가 있습니까? 명령 행 체인의 다음 명령으로 출력을 구문 분석 할 수 있습니다. 작업 환경은 Linux이지만 다른 옵션도 환영합니다.

27 descriptive-statistics computational-statistics computing

3

산술 평균이 기하 평균에 매우 가까운 경우 데이터에 대해 무엇을 결론 낼 수 있습니까?

~ 0.1 %와 같이 서로 매우 근접한 기하 평균과 산술 평균에 대해 중요한 것이 있습니까? 그러한 데이터 세트에 대해 어떤 추측을 할 수 있습니까? 나는 데이터 세트를 분석하려고 노력했으며, 아이러니하게도 값이 매우 가깝다는 것을 알았습니다. 정확하지는 않지만 가깝습니다. 또한 산술 평균 기하학 평균 불평등의 빠른 온 전성 검사와 데이터 수집 …

24 descriptive-statistics mean geometric-mean

5

순전히 예측 모델링을 수행 할 때 탐색 적 데이터 분석이 중요합니까?

기계 학습 기술을 사용하여 예측 모델을 구축 할 때 탐색 적 데이터 분석 (EDA)의 요점은 무엇입니까? 기능 생성 및 모델 작성으로 바로 넘어가도 되나요? EDA에서 사용되는 기술 통계량은 어떻게 중요합니까?

23 machine-learning predictive-models descriptive-statistics eda

6

평균 가치 역설-이것이 무엇입니까?

데이터 세트가 있습니다. 관측치와 변수를 말합니다 .101010333 obs A B C 1 0 0 1 2 0 1 0 3 1 0 1 4 1 1 0 5 1 0 1 6 1 0 0 7 1 1 0 8 0 0 1 9 0 1 1 10 0 1 …

22 proportion descriptive-statistics paradox

4

기술 통계량을보고하는 요점은 무엇입니까?

로지스틱 회귀를 사용하여 데이터를 분석했지만 보고서에 기술 통계 부분이 있어야합니다. 나는 솔직히 이것의 요점을 보지 못했고 누군가 왜 그것이 필요한지 설명 할 수 있기를 바랐습니다. 예를 들어, 독립적 인 연속 변수 중 하나의 히스토그램을 플로팅하고 정규성을 보이거나 왜이 값이 보고서에 어떤 값을 추가 할 것인가를 보여주는 경우? 내 데이터는 취업에 …

21 descriptive-statistics reporting

1

상자와 수염이 같은 Anscombe와 유사한 데이터 세트 (평균 / 표준 / 중앙 / MAD / 최소 / 최대)

편집 :이 질문이 팽창함에 따라 요약 : 동일한 혼합 통계 (평균, 중간, 중간 범위 및 관련 분산 및 회귀)로 다른 의미 있고 해석 가능한 데이터 집합 찾기 Anscombe 중주 (참조 ? 고차원 데이터를 시각화 목적 ) 네의 유명한 예는 - (네에서 동일한 한계 평균 / 표준 편차, 데이터 집합 4 …

21 regression descriptive-statistics curve-fitting estimators

6

기술 통계량과 추론 통계의 차이점은 무엇입니까?

필자는 이해 통계가 데이터 샘플의 기능을 정량적으로 설명하는 반면 추론 통계는 샘플을 추출한 모집단에 대해 추론했다는 것을 이해했습니다. 그러나 통계적 추론 상태에 대한 Wikipedia 페이지는 다음과 같습니다. 대부분의 경우 통계적 추론은 임의의 형태의 무작위 표본 추출을 통해 관심있는 모집단에서 얻은 데이터를 사용하여 모집단에 대해 제안합니다. "대부분"은 내가이 개념들을 제대로 이해하지 …

21 terminology descriptive-statistics inference

4

"편견없는"은 무엇을 의미합니까?

"분산은 편향 추정기"라는 말의 의미는 무엇입니까? 간단한 공식을 통해 편향 추정치를 편향 추정치로 변환하는 것은 무엇을 의미합니까? 이 전환은 정확히 무엇을합니까? 또한이 전환의 실제적인 용도는 무엇입니까? 특정 종류의 통계를 사용할 때이 점수를 변환합니까?

21 theory unbiased-estimator descriptive-statistics

2

로그 변환 후 표준 오류 계산

정규 분포를 따르는 임의의 숫자 세트를 고려하십시오. x <- rnorm(n=1000, mean=10) 우리는 평균에 대한 평균과 표준 오차를 알고 싶습니다. 그래서 우리는 다음을 수행합니다. se <- function(x) { sd(x)/sqrt(length(x)) } mean(x) # something near 10.0 units se(x) # something near 0.03 units 큰! 그러나 원래 분포가 정규 분포를 따른다는 것을 반드시 …

19 confidence-interval data-transformation descriptive-statistics

3

비정규 분포 표본에서 평균의 신뢰 구간을 어떻게 계산할 수 있습니까?

비정규 분포 표본에서 평균의 신뢰 구간을 어떻게 계산할 수 있습니까? 부트 스트랩 방법이 여기에서 일반적으로 사용된다는 것을 알고 있지만 다른 옵션을 사용할 수 있습니다. 비모수 적 옵션을 찾고있는 동안 누군가 파라 메트릭 솔루션이 유효하다고 확신 할 수 있다면 좋을 것입니다. 샘플 크기는> 400입니다. 누구나 R로 샘플을 줄 수 있다면 대단히 …

19 confidence-interval nonparametric bootstrap descriptive-statistics skewness

5

직관 (기하학적 또는 기타)

분산의 기본 정체성을 고려하십시오. Var(X)===E[(X−E[X])2]...E[X2]−(E[X])2Var(X)=E[(X−E[X])2]=...=E[X2]−(E[X])2 \begin{eqnarray} Var(X) &=& E[(X - E[X])^2]\\ &=& ...\\ &=& E[X^2] - (E[X])^2 \end{eqnarray} 중심 모멘트를 중심이 아닌 모멘트로 정의하는 간단한 대수적 조작입니다. 다른 상황에서 를 편리하게 조작 할 수 있습니다. 또한 평균을 계산 한 다음 분산을 계산하기 위해 두 패스가 아닌 단일 패스 데이터를 통해 …

18 variance descriptive-statistics intuition

4

상관 관계의 비 일시성 : 성별과 뇌의 크기, 뇌의 크기와 IQ 간의 상관 관계는 있지만 성별과 IQ의 상관 관계는 없음

블로그에서 다음 설명을 발견했으며 상관의 비 일시성에 대한 자세한 정보를 얻고 싶습니다. 다음과 같은 확실한 사실이 있습니다. 평균적으로 남성과 여성의 뇌량에는 차이가 있습니다 IQ와 뇌 크기 사이에는 상관 관계가 있습니다. 상관 관계는 0.33이므로 IQ 변동성의 10 %에 해당합니다. 이 구내 1과 2에서 논리적으로 다음과 같이 보입니다. 평균적으로 여성은 남성보다 IQ가 …

18 correlation categorical-data mean descriptive-statistics neuroscience

5

범주 형 또는 정 성적 변수와 함께 사용할 요약 통계는 무엇입니까?

간단히 말하면 요약 통계를 의미 할 때 평균, 사 분위수 범위, 분산, 표준 편차를 나타냅니다. 명목 및 순서를 모두 고려하여 범주 형 또는 정성형 일 변량을 요약 할 때 평균, 중앙값, 사 분위수 범위, 분산 및 표준 편차를 찾는 것이 합리적입니까? 그렇다면 연속 변수를 요약하는 것과 다른 점은 무엇입니까?

18 categorical-data descriptive-statistics

6

SAS PROC FREQ와 동등한 R이 있습니까?

누구든지 SAS와 동등한 R을 알고 PROC FREQ있습니까? 여러 변수에 대한 요약 설명 통계를 한 번에 생성하려고합니다.

18 r descriptive-statistics sas

3

"통계 실험"과 "통계 모델"의 차이점은 무엇입니까?

나는 AW van der Vaart, asymptotic statistics (1998)를 따르고 있습니다. 그는 통계 실험과 통계 모델과는 다르다고 주장하지만, 둘 다 정의하지는 않습니다. 내 질문: (1) 통계 실험, (2) 통계 모델 및 (3) 통계 실험을 통계 모델과 구분할 수있는 핵심 요소는 무엇입니까?

17 mathematical-statistics inference experiment-design descriptive-statistics model

«descriptive-statistics» 태그된 질문