«descriptive-statistics» 태그된 질문

기술 통계량은 평균 및 표준 편차, 중앙값 및 사 분위수, 최대 값 및 최소값과 같은 샘플의 기능을 요약합니다. 여러 변수가있는 경우 상관 관계 및 크로스 탭이 포함될 수 있습니다. 박스 플롯, 히스토그램, 산점도 등의 시각적 디스플레이를 포함 할 수 있습니다.

3
그것을 증명하는 방법
불평등을 설정하려고 노력했습니다 |티나는| =∣∣엑스나는−엑스¯∣∣에스≤n - 1엔−−√|Ti|=|Xi−X¯|S≤n−1n\left| T_i \right|=\frac{\left|X_i -\bar{X} \right|}{S} \leq\frac{n-1}{\sqrt{n}} 어디 엑스¯X¯\bar{X} 표본 평균이고 에스SS 표본 표준 편차, 즉 에스=∑엔나는 = 1(엑스나는−엑스¯)2n - 1−−−−−−−−−√S=∑i=1n(Xi−X¯)2n−1S=\sqrt{\frac{\sum_{i=1}^n \left( X_i -\bar{X} \right)^2}{n-1}}. 보기 쉽다 ∑엔나는 = 1티2나는= n − 1∑i=1nTi2=n−1\sum_{i=1}^n T_i^2 = n-1 그래서 |티나는| &lt;n - 1−−−−−√|Ti|&lt;n−1\left| T_i \right| < \sqrt{n-1}그러나 …

2
직접 선 세그먼트의 혼란을 시각적으로 요약
수백만 개의 직접 선 세그먼트 데이터 세트가 있습니다. 선분은 순차적입니다. 기후 변수 (현열)이며 30 분 간격으로 관찰 및 시뮬레이션 된 값을 갖습니다. 시뮬레이션이 수행되는 방식에서 패턴을 찾으려고합니다. obs vs 시뮬레이션 값의 산점도를보고 선분과 연결합니다 (화살표는 시간 방향을 나타냄). 내가 플롯하면 다음과 같이 해석하기 어려운 흐릿한 혼란이 생깁니다. 이것은 10000 라인의 …

2
혼합 모델을위한 파라 메트릭, 세미 파라 메트릭 및 비 파라 메트릭 부트 스트랩
이 기사 에서 다음과 같은 이식편을 가져옵니다 . 부트 스트랩을 사용하고 R boot패키지가있는 선형 혼합 모델을 위해 파라 메트릭, 반 파라 메트릭 및 비 파라 메트릭 부트 스트랩 부트 스트랩을 구현하려고 초보자 입니다. R 코드 내 R코드 는 다음과 같습니다 . library(SASmixed) library(lme4) library(boot) fm1Cult &lt;- lmer(drywt ~ Inoc + …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

2
이 데이터 집합에 공분산이없는 이유는 무엇입니까?
공분산의 작동 방식에 대한 이해는 상관 관계가있는 데이터의 공분산이 다소 높아야한다는 것입니다. 산점도에 표시된 것처럼 데이터가 상관 관계가 있지만 공분산이 거의 0에 가까운 상황을 겪었습니다. 상관 관계가있는 데이터의 공분산은 어떻게 0이 될 수 있습니까? import numpy as np x1 = np.array([ 0.03551153, 0.01656052, 0.03344669, 0.02551755, 0.02344788, 0.02904475, 0.03334179, 0.02683399, 0.02966126, …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.