«normality-assumption» 태그된 질문

많은 통계적 방법은 데이터가 정규 분포되어 있다고 가정합니다. 정규성의 가정 및 테스트 또는 * 속성 *의 정규성에 대한 질문에이 태그를 사용하십시오. 정규 분포 자체에 대한 질문은 [정규 분포]를 사용하십시오.

2
자연 어딘가에 정상적인 곡선의 모양을 볼 수 있습니까?
자연의 일부 현상이 정규 분포를 갖는지 알고 싶지 않지만 Galton 상자에서 볼 수 있듯이 정상적인 곡선의 모양을 볼 수 있는지 여부를 알고 싶습니다. Wikipedia 에서이 그림을 참조하십시오 . 많은 수학적 모양이나 곡선은 자연에서 직접 볼 수 있습니다. 예를 들어, 황금 평균과 대수 나선 은 달팽이에서 찾을 수 있습니다. 첫 번째 …

4
정상 rv의 첨도 및 왜도를 증가시키는 변형
나는 관측 값 가 정규 분포 되어 있다는 사실에 의존하는 알고리즘을 연구하고 있으며 경험적 으로이 가정에 대한 알고리즘의 견고성을 테스트하고 싶습니다.와이YY 이를 위해 의 정규성을 점진적으로 중단시키는 일련의 변환 을 . 예를 들어, 가 정상 왜도 이고 첨도 이므로 점진적으로 증가하는 변형 순서를 찾는 것이 좋습니다.Y Y = 0 = …

4
엣지 케이스의 정밀도 및 리콜에 대한 올바른 값은 무엇입니까?
정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

3
중앙 한계 정리에 큰 표본 크기가 필요한 분포의 예
일부 책은 중앙 한계 정리가 대한 근사치를 제공하기 위해 크기가 30 이상인 표본 크기가 필요하다고 명시합니다 . 엑스¯엑스¯\bar{X} 이것이 모든 배포에 충분하지 않다는 것을 알고 있습니다. 큰 표본 크기 (아마도 100 또는 1000 이상)에서도 표본 평균의 분포가 여전히 치우친 분포의 일부 예를보고 싶습니다. 나는 이전에 그러한 예를 보았지만 어디에서 찾을 …

2
데이터가 정규 분포가 아닌 경우 두 그룹 평균 간의 차이를 테스트하는 방법은 무엇입니까?
생물학적 세부 사항과 실험을 모두 제거하고 당면한 문제와 통계적으로 수행 한 작업을 인용하겠습니다. 나는 그것이 올바른지 아닌지, 어떻게 진행하는지 알고 싶습니다. 데이터 (또는 내 설명)가 충분하지 않으면 편집하여 더 잘 설명하려고 노력할 것입니다. 크기가 이고 두 개의 그룹 / 관찰, X 및 Y가 있다고 가정하십시오 . 이 두 관측치의 평균이 …

4
특이 치의 Box and Whisker Plot 정의의 기초는 무엇입니까?
Box and Whisker 그림에 대한 특이 표준 정의는 범위를 벗어난 점입니다. 여기서 및 은 첫 번째 사 분위수 및 데이터의 3 분위입니다.{Q1−1.5IQR,Q3+1.5IQR}{Q1−1.5IQR,Q3+1.5IQR}\left\{Q1-1.5IQR,Q3+1.5IQR\right\}IQR=Q3−Q1IQR=Q3−Q1IQR= Q3-Q1Q1Q1Q1Q3Q3Q3 이 정의의 기초는 무엇입니까? 점이 많으면 완전 정규 분포라도 특이 치를 반환합니다. 예를 들어 시퀀스로 시작한다고 가정합니다. xseq<-seq(1-.5^1/4000,.5^1/4000, by = -.00025) 이 시퀀스는 4000 포인트의 백분위 수 …

1
왜 우리는 오류가 정규 분포라고 가정합니까?
오류를 모델링 할 때 왜 가우시안 가정을 ​​사용해야하는지 궁금합니다. 에서 스탠포드의 ML 과정 , 교수 잉은 두 가지 방식으로 기본적으로 설명 : 수학적으로 편리합니다. (최소 제곱 피팅과 관련이 있으며 의사 역수로 쉽게 해결할 수 있습니다) 중앙 한계 정리로 인해 프로세스에 영향을 미치는 많은 기본 사실이 있다고 가정 할 수 있으며 …

2
정규성 가정에 대해 F- 검정이 왜 그렇게 민감한가요?
이유 인 F 에도 큰 들면, 정규 분포의 가정에 민감한 변화의 차이 -test ?NNN 웹을 검색하고 라이브러리를 방문했지만 그중 어느 것도 좋은 대답을하지 못했습니다. 이 테스트는 정규 분포에 대한 가정을 위반하는 데 매우 민감하지만 그 이유를 이해하지 못합니다. 누구든지 이것에 대한 좋은 대답이 있습니까?

5
표본의 표본 추출 분포는 모집단 평균과 어떻게 비슷합니까?
통계를 배우려고 노력하고 있는데, 그것이 제대로 이해되지 않으면 어떤 것들을 배우지 못하게 막는 것이 널리 퍼져 있기 때문입니다. 샘플 수단의 샘플링 분포에 대한이 개념을 이해하는 데 어려움이 있습니다. 일부 책과 사이트에서 설명하는 방식을 이해할 수 없습니다. 나는 이해가 있다고 생각하지만 그것이 정확한지 확실하지 않습니다. 아래는 그것을 이해하려는 시도입니다. 정규 분포를 …

2
반복 측정 ANOVA : 정규성 가정이란 무엇입니까?
반복 측정 ANOVA에서 정규성 가정에 대해 혼란스러워합니다. 구체적으로, 나는 어떤 종류의 정규성이 정확히 충족되어야하는지 궁금합니다. 이력서에 대한 문헌과 답변을 읽을 때 나는이 가정에 대한 세 가지 뚜렷한 표현을 발견했습니다. 각 (반복) 조건 내 종속 변수는 정상적으로 분포되어야합니다. rANOVA는 ANOVA와 같은 가정과 구형도를 갖는 것으로 종종 언급됩니다. 그것은 Field 's Discovering …

1
R : 선형 모형 잔차의 정규성을 테스트-사용할 잔차
정규성을 확인하기 위해 선형 모형의 잔차에 대해 Shapiro Wilk의 W 검정 및 Kolmogorov-Smirnov 검정을 수행하고 싶습니다. 원시 잔차, Pearson 잔차, 학생 잔차 또는 표준화 잔차에 대해 어떤 잔차를 사용해야하는지 궁금합니다. Shapiro-Wilk의 W 테스트의 경우 원시 및 Pearson 잔차에 대한 결과는 동일하지만 다른 결과는 그렇지 않은 것으로 보입니다. fit=lm(mpg ~ 1 …

1
GBM 패키지와 GBM을 사용하는 Caret
을 사용하여 모델 튜닝을 수행 caret했지만 gbm패키지를 사용하여 모델을 다시 실행했습니다 . caret패키지가 사용 gbm하고 출력이 동일해야한다는 것을 이해합니다 . 그러나 data(iris)RMSE와 R ^ 2를 평가 지표로 사용하면 약 5 %의 모델에서 불일치가 발생합니다. 부분 종속성 플롯을 사용 하기 위해 최적의 모델 성능을 찾고 caret싶지만 다시 실행 하고 싶습니다 gbm. …

2
분산 분석의 정규성 가정에서 출발 : 첨도 또는 왜도가 더 중요합니까?
Kutner 등의 응용 선형 통계 모델. ANOVA 모델의 정규성 가정에서 벗어난 것과 관련하여 다음과 같이 설명 합니다. 오차 분포의 첨도 (정규 분포보다 많거나 적은 피크)는 추론에 미치는 영향 측면에서 분포의 왜도보다 중요합니다 . 나는이 진술에 약간 당황하고 책이나 온라인에서 관련 정보를 찾지 못했습니다. 또한 꼬리가 두꺼운 QQ- 플로트는 선형 회귀 …

1
항상 부트 스트랩 CI를 사용하지 않는 이유는 무엇입니까?
부트 스트랩 CI (및 Barticular의 BCa)가 정규 분포 데이터에서 어떻게 수행되는지 궁금합니다. 다양한 유형의 분포에서 성능을 검사하는 작업이 많지만 정규 분포 데이터에서 아무것도 찾을 수 없습니다. 먼저 공부해야 할 것이 분명해 보이므로 논문이 너무 오래되었다고 생각합니다. R 부트 패키지를 사용하여 Monte Carlo 시뮬레이션을 수행하고 부트 스트랩 CI가 정확한 CI와 일치하는 …

5
매우 많은 수의 데이터 포인트에서 값을 대치하는 방법은 무엇입니까?
데이터 세트가 매우 커서 약 5 %의 임의 값이 없습니다. 이 변수들은 서로 상관되어 있습니다. 다음 예제 R 데이터 세트는 더미 상관 데이터가있는 장난감 예제 일뿐입니다. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.