«distributions» 태그된 질문

분포는 확률 또는 빈도에 대한 수학적 설명입니다.


5
샘플링 분포를 가르치기위한 전략
tl; dr 버전 입문 학부 수준에서 (예를 들어 표본 평균의) 표본 분포를 가르치기 위해 어떤 성공적인 전략을 사용하십니까? 배경 9 월에는 David Moore 의 기본 통계 실습을 사용하여 2 학년 사회 과학 (주로 정치 과학 및 사회학) 학생들을위한 입문 통계 과정을 가르치게 됩니다. 내가이 과정을 가르친 것은 다섯 번째 일 …


5
정규 분포를 따르는 자연 현상이 너무 많은 이유에 대한 설명이 있습니까?
나는 이것이 매혹적인 주제라고 생각하며 그것을 완전히 이해하지 못한다. 많은 자연 현상이 정규 분포를 갖도록 물리 법칙은 무엇입니까? 그것들이 균일 한 분포를 갖는 것이 더 직관적 인 것처럼 보일 것입니다. 이해하기가 너무 어려워서 정보가 누락 된 것 같습니다. 누군가 좋은 설명을하도록 도와 주거나 책 / 비디오 / 문서로 연결시킬 수 …

5
머신 러닝에서 계층 적 / 중첩 된 데이터를 처리하는 방법
예를 들어 내 문제를 설명하겠습니다. {나이, 성별, 국가, 지역, 도시}와 같은 속성이 주어진 개인의 소득을 예측한다고 가정합니다. 당신은 이와 같은 훈련 데이터 세트를 가지고 있습니다 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

4
그래픽 모델에서 그래프 이론은 어디에 있습니까?
그래픽 모델에 대한 소개는 그것들을 "... 그래프 이론과 확률 이론의 결혼"으로 묘사합니다. 확률 이론 부분을 얻었지만 정확한 그래프 이론이 어디에 적합한 지 이해하는 데 어려움이 있습니다. 그래프 이론의 통찰력은 불확실성에서 확률 분포와 의사 결정에 대한 이해를 심화시키는 데 도움이 되었습니까? PGM을 "트리"또는 "이중"또는 "비 지향"으로 분류하는 등 PGM에서 그래프 이론 …

3
부트 스트랩 배포의 평균을보고하지 않는 이유는 무엇입니까?
표준 오류를 얻기 위해 매개 변수를 부트 스트랩하면 매개 변수의 분포를 얻습니다. 왜 우리는 그 분포의 평균을 우리가 얻으려는 모수에 대한 결과 또는 추정치로 사용하지 않습니까? 분포가 실제 분포와 비슷하지 않아야합니까? 그러므로 우리는 "실제"가치의 좋은 추정치를 얻을 수 있을까요? 그러나 샘플에서 얻은 원래 매개 변수를보고합니다. 왜 그런가요? 감사

3
포아송 분포는 정규 분포와 어떻게 다릅니 까?
다음과 같이 포아송 분포를 갖는 벡터를 생성했습니다. x = rpois(1000,10) 를 사용하여 히스토그램을 만들면 hist(x)분포는 익숙한 종 모양의 정규 분포처럼 보입니다. 그러나 Kolmogorov-Smirnoff 테스트 ks.test(x, 'pnorm',10,3)는 분포가 매우 작은 p값 으로 인해 정규 분포와 크게 다릅니다 . 그래서 내 질문은 히스토그램이 정규 분포와 너무 비슷해 보일 때 포아송 분포와 정규 …

6
Shapiro-Wilk 테스트의 해석
통계가 처음이므로 도움이 필요합니다. 다음과 같이 작은 샘플이 있습니다. H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 R을 사용하여 Shapiro-Wilk 테스트를 실행했습니다. shapiro.test(precisionH4U$H4U) 그리고 나는 다음과 같은 결과를 얻었다 : W = 0.9502, p-value = 0.6921 이제 p- 값보다 0.05의 유의 수준이 알파보다 크면 (0.6921> 0.05) 정규 분포에 …

3
R : 데이터 집합에 NaN이 없어도 "외부 함수 호출"오류에서 NaN / Inf를 발생시키는 임의 포리스트 [닫기]
캐럿을 사용하여 데이터 세트에 대해 교차 유효성 검사 임의 포리스트를 실행하고 있습니다. Y 변수는 요인입니다. 내 데이터 세트에 NaN, Inf 또는 NA가 없습니다. 그러나 임의의 포리스트를 실행하면 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see …

4
분포의 불균일성을 어떻게 측정합니까?
내가 실행중인 실험에 대한 분포의 불균일성을 측정하기위한 메트릭을 만들려고합니다. 나는 대부분의 경우 균일하게 분포되어야하는 임의의 변수를 가지고 있으며 변수가 어느 정도의 범위 내에서 균일하게 분포되어 있지 않은 데이터 세트의 예를 식별하고 가능한 정도를 측정하고 싶습니다. 내가 측정하고있는 것의 발생 빈도를 나타내는 10 개의 측정치가있는 각각 3 개의 데이터 시리즈의 예는 …

7
이전 코인 플립의 결과가 후속 코인 플립에 대한 신념에 영향을 미치는 통계적 오류의 이름은 무엇입니까?
우리 모두 알다시피, 꼬리처럼 머리를 착륙시킬 확률이 같은 동전을 뒤집 으면 동전을 여러 번 뒤집 으면 머리를 얻는 시간의 절반, 꼬리를 얻는 시간의 절반이됩니다. 친구와 이것을 토론 할 때, 동전을 1000 번 뒤집고 머리에 처음으로 100 번 착륙한다고하면 꼬리를 착륙 할 확률이 증가했습니다 (논리적 편견이 없다면 논리, 그런 다음 1000 …


3
가우스 비율 분포 : 미분 계수
나는 두 개의 독립적 인 정규 분포 XXX 와 작업하고 있는데 YYY, 평균 μxμx\mu_x 및 μyμy\mu_y 및 분산 σ2xσx2\sigma^2_x 및 σ2yσy2\sigma^2_y 입니다. 나는 그들의 비율 의 분포에 관심이 Z=X/YZ=X/YZ=X/Y있습니다. 나도 XXX 나 YYY , 그래서 0의 평균이 없습니다 ZZZ 코시로 배포되지 않습니다. 의 CDF를 찾은 다음 μ x , μ …

7
임의의 이산 분포를 기반으로 숫자를 생성하는 방법은 무엇입니까?
임의의 이산 분포를 기반으로 숫자를 생성하려면 어떻게합니까? 예를 들어, 생성하려는 숫자 세트가 있습니다. 다음과 같이 1-3에서 레이블이 지정되어 있다고 가정하십시오. 1 : 4 %, 2 : 50 %, 3 : 46 % 기본적으로 백분율은 난수 생성기의 출력에 나타날 확률입니다. 간격 [0, 1]에서 균일 분포를 생성하는 의사 난수 생성기가 있습니다. 이 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.