«normal-distribution» 태그된 질문

정규 분포 또는 가우스 분포에는 대칭 종 모양의 곡선 인 밀도 함수가 있습니다. 통계에서 가장 중요한 분포 중 하나입니다. 정규성 테스트에 대해 질문하려면 [normality] 태그를 사용하십시오.



2
왜 일반 오류 대신 t 오류를 사용해야합니까?
에서 이 앤드류 겔만으로 블로그 게시물, 다음과 같은 구절이있다 : 50 년 전의 베이지안 모델은 절망적으로 단순 해 보이지만 (물론 간단한 문제는 제외하고) 오늘날의 베이지안 모델은 50 년 동안 절망적으로 단순 해 보일 것으로 기대합니다. (간단한 예를 들자면, 우리는 아마도 어디에서나 일반적인 오류 대신에 t를 일상적으로 사용해야 할 것입니다. 그러나 …

5
정규 분포를 따르는 자연 현상이 너무 많은 이유에 대한 설명이 있습니까?
나는 이것이 매혹적인 주제라고 생각하며 그것을 완전히 이해하지 못한다. 많은 자연 현상이 정규 분포를 갖도록 물리 법칙은 무엇입니까? 그것들이 균일 한 분포를 갖는 것이 더 직관적 인 것처럼 보일 것입니다. 이해하기가 너무 어려워서 정보가 누락 된 것 같습니다. 누군가 좋은 설명을하도록 도와 주거나 책 / 비디오 / 문서로 연결시킬 수 …

5
머신 러닝에서 계층 적 / 중첩 된 데이터를 처리하는 방법
예를 들어 내 문제를 설명하겠습니다. {나이, 성별, 국가, 지역, 도시}와 같은 속성이 주어진 개인의 소득을 예측한다고 가정합니다. 당신은 이와 같은 훈련 데이터 세트를 가지고 있습니다 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

3
포아송 분포는 정규 분포와 어떻게 다릅니 까?
다음과 같이 포아송 분포를 갖는 벡터를 생성했습니다. x = rpois(1000,10) 를 사용하여 히스토그램을 만들면 hist(x)분포는 익숙한 종 모양의 정규 분포처럼 보입니다. 그러나 Kolmogorov-Smirnoff 테스트 ks.test(x, 'pnorm',10,3)는 분포가 매우 작은 p값 으로 인해 정규 분포와 크게 다릅니다 . 그래서 내 질문은 히스토그램이 정규 분포와 너무 비슷해 보일 때 포아송 분포와 정규 …

3
R : 데이터 집합에 NaN이 없어도 "외부 함수 호출"오류에서 NaN / Inf를 발생시키는 임의 포리스트 [닫기]
캐럿을 사용하여 데이터 세트에 대해 교차 유효성 검사 임의 포리스트를 실행하고 있습니다. Y 변수는 요인입니다. 내 데이터 세트에 NaN, Inf 또는 NA가 없습니다. 그러나 임의의 포리스트를 실행하면 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see …

2
통계의 화이트 노이즈
다른 통계 모델을 읽을 때 종종 백색 잡음이라는 용어가 나타납니다. 그러나 이것이 무엇을 의미하는지 완전히 확신하지 못한다는 것을 인정해야합니다. 일반적으로 로 축약됩니다 . 그것은 그것이 정상적으로 배포되었거나 배포를 따를 수 있다는 것을 의미합니까?여엔( 0 , σ2)WN(0,σ2)WN(0,σ^2)

3
가우스 비율 분포 : 미분 계수
나는 두 개의 독립적 인 정규 분포 XXX 와 작업하고 있는데 YYY, 평균 μxμx\mu_x 및 μyμy\mu_y 및 분산 σ2xσx2\sigma^2_x 및 σ2yσy2\sigma^2_y 입니다. 나는 그들의 비율 의 분포에 관심이 Z=X/YZ=X/YZ=X/Y있습니다. 나도 XXX 나 YYY , 그래서 0의 평균이 없습니다 ZZZ 코시로 배포되지 않습니다. 의 CDF를 찾은 다음 μ x , μ …

5
공통 분포의 실제 예
통계에 관심을 갖고있는 대학원생입니다. 나는 자료 전체를 좋아하지만 때로는 실생활에서의 응용에 대해 생각하기가 어렵다. 특히, 내 질문은 일반적으로 사용되는 통계 분포 (정상-베타 감마 등)에 관한 것입니다. 어떤 경우에는 분포를 아주 좋게 만드는 특정 속성을 얻습니다-예를 들어 지수가없는 메모리리스 속성. 그러나 다른 많은 경우에는 교과서에서 볼 수있는 공통 배포판의 중요성과 적용 …

2
경험적 분포와 가우스 모델 간의 교차 엔트로피 평균 제곱 오차가 왜됩니까?
5.5에서는 딥 러닝 (Ian Goodfellow, Yoshua Bengio 및 Aaron Courville의)에 따르면 음의 로그 우도로 구성된 손실은 훈련 세트에 의해 정의 된 경험적 분포와 모델에 의해 정의 된 확률 분포 사이의 교차 엔트로피입니다. 예를 들어, 평균 제곱 오차는 경험적 분포와 가우스 모델 간의 교차 엔트로피입니다. 나는 그들이 왜 동등한 지 이해할 …

1
자유도는 정수가 아닌 숫자 일 수 있습니까?
GAM을 사용할 때 잔여 DF는 (코드의 마지막 줄). 그게 무슨 뜻이야? GAM 예제를 넘어 서면 일반적으로 자유도는 정수가 아닌 숫자 일 수 있습니까?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 


5
선형 회귀는 정규 분포를 어떻게 사용합니까?
선형 회귀 분석에서 각 예측 값은 가능한 값의 정규 분포에서 선택되었다고 가정합니다. 아래를 참조하십시오. 그러나 각 예측값이 정규 분포에서 나온 것으로 가정하는 이유는 무엇입니까? 선형 회귀는이 가정을 어떻게 사용합니까? 가능한 값이 정규 분포를 따르지 않으면 어떻게됩니까?


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.