«sampling» 태그된 질문

확률 적 방법을 사용하여 잘 지정된 모집단에서 표본을 생성하거나 지정된 분포에서 난수를 생성합니다. 이 태그가 모호하므로 전자의 경우 [측량 샘플링]과 후자의 경우 [몬테카를로] 또는 [시뮬레이션]을 고려하십시오. 알려진 분포에서 무작위 표본을 생성하는 것에 대한 질문은 [random-generation] 태그 사용을 고려하십시오.

12
95 % 신뢰 구간 (CI)이 95 %의 평균을 포함 할 가능성을 의미하지 않는 이유는 무엇입니까?
여기에서 다양한 관련 질문을 통해 "95 % 신뢰 구간"이라고하는 "95 %"부분은 샘플링과 CI 계산 절차를 여러 번 정확하게 복제해야한다면 따라서 계산 된 CI의 95 %에 모집단 평균이 포함됩니다. 또한이 정의가하는 합의 인 것 같습니다 그렇지 않다는평균이 CI 내 어딘가에있을 확률이 95 %라는 단일 95 % CI로부터 결론을 내릴 수 있습니다. …

8
'빅 데이터'시점에서 샘플링이 관련이 있습니까?
아니면 더 "그렇게 될까"? 빅 데이터 는 통계와 관련 지식을 더욱 중요하게하지만 샘플링 이론을 수행하는 것으로 보입니다. 나는 '빅 데이터'에 대한이 과대 광고를 보았고 "왜"가 모든 것을 분석하고 싶은지 궁금해 할 수 없습니다 . "샘플링 이론"을 설계 / 구현 / 발명 / 발견 할 이유가 없었습니까? 데이터 세트의 전체 '인구'를 …

5
표본 중앙값에 대한 중앙 한계 정리
동일한 분포에서 도출 된 충분히 많은 관측치의 중앙값을 계산하면 중앙값의 중앙값 분포가 정규 분포에 근사 할 것입니까? 내 이해는 이것이 많은 수의 샘플을 사용하면 사실이지만 중간 값에서도 사실이라는 것입니다. 그렇지 않은 경우 샘플 중앙값의 기본 분포는 무엇입니까?

5
표본이 모집 단일 때의 통계적 추론
매년 특정 시험을 보는 응시자 수를보고해야한다고 상상해보십시오. 예를 들어, 대상 집단의 특이성으로 인해 더 넓은 집단에서 성공률의 관찰 된 비율을 추론하기는 다소 어려워 보입니다. 따라서이 데이터가 전체 인구를 나타내는 것으로 간주 할 수 있습니다. 테스트 결과 남성과 여성의 비율이 실제로 다른 것으로 나타 났습니까? 전체 모집단 (샘플이 아님)을 고려하기 때문에 …

4
기존의 프로그래밍 언어를 사용하여 알려진 평균 및 분산을 갖는 정규 분포에서 표본을 추출하는 방법은 무엇입니까?
나는 통계 과정을 한 번도 본 적이 없으므로 여기에 올바른 장소에 묻기를 바랍니다. 정규 분포를 나타내는 두 개의 데이터, 즉 평균 및 분산 만 있다고 가정 합니다. 컴퓨터를 사용 하여이 두 분포를 무작위로 샘플링 하여이 두 통계를 존중하고 싶습니다.σ 2μμ\muσ2σ2\sigma^2 샘플을 출력하기 전에 각 샘플에 를 추가하기 만하면 0을 정규화하여 …

5
표본 크기를 늘리면 (샘플링) 분산이 낮아지는 이유는 무엇입니까?
큰 그림: 샘플 크기를 늘리면 실험의 힘이 어떻게 증가하는지 이해하려고합니다. 강사의 슬라이드는 두 가지 정규 분포, 하나는 귀무 가설에 대한 것과 다른 하나는 대립 가설에 대한 것, 그리고 그 사이의 결정 임계 값 c를 사용하여 설명합니다. 그들은 표본 크기가 증가하면 분산이 낮아지고 첨도가 높아져 곡선 아래의 공유 영역이 줄어들어 유형 …


5
정치 여론 조사에 왜 이렇게 큰 표본 크기가 있습니까?
뉴스를 보았을 때 대통령 선거와 같은 것들에 대한 갤럽 여론 조사에서 표본 크기가 1,000 개가 넘는 것으로 나타났습니다. 내가 대학 통계에서 기억하는 것으로부터 표본 크기 30은 "상당히 큰"표본이라는 것이 었습니다. 반품 감소로 인해 30을 초과하는 샘플 크기는 의미가없는 것으로 보입니다.

5
샘플링 분포를 가르치기위한 전략
tl; dr 버전 입문 학부 수준에서 (예를 들어 표본 평균의) 표본 분포를 가르치기 위해 어떤 성공적인 전략을 사용하십니까? 배경 9 월에는 David Moore 의 기본 통계 실습을 사용하여 2 학년 사회 과학 (주로 정치 과학 및 사회학) 학생들을위한 입문 통계 과정을 가르치게 됩니다. 내가이 과정을 가르친 것은 다섯 번째 일 …

3
R : 데이터 집합에 NaN이 없어도 "외부 함수 호출"오류에서 NaN / Inf를 발생시키는 임의 포리스트 [닫기]
캐럿을 사용하여 데이터 세트에 대해 교차 유효성 검사 임의 포리스트를 실행하고 있습니다. Y 변수는 요인입니다. 내 데이터 세트에 NaN, Inf 또는 NA가 없습니다. 그러나 임의의 포리스트를 실행하면 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see …


7
이전 코인 플립의 결과가 후속 코인 플립에 대한 신념에 영향을 미치는 통계적 오류의 이름은 무엇입니까?
우리 모두 알다시피, 꼬리처럼 머리를 착륙시킬 확률이 같은 동전을 뒤집 으면 동전을 여러 번 뒤집 으면 머리를 얻는 시간의 절반, 꼬리를 얻는 시간의 절반이됩니다. 친구와 이것을 토론 할 때, 동전을 1000 번 뒤집고 머리에 처음으로 100 번 착륙한다고하면 꼬리를 착륙 할 확률이 증가했습니다 (논리적 편견이 없다면 논리, 그런 다음 1000 …

3
무작위 표본이 명확하지 않은 경우 어떻게해야합니까?
당신은 무작위로 샘플을 채취하고 그것이 같이 명확하게 반영하지 않고 볼 수있는 경우에는 어떻게 최근 질문 . 예를 들어 모집단 분포가 0을 기준으로 대칭 인 것으로 가정하고 무작위로 추출한 표본에 불균형 긍정적 및 부정적 관측치가 있고 불균형이 통계적으로 유의하면 어디에서 벗어날 수 있습니까? 치우친 표본을 기반으로 모집단에 대해 어떤 합리적인 진술을 …

1
lmer 모델의 효과 반복 계산
방금 혼합 효과 모델링을 통해 측정의 반복성 (일명 신뢰성, 일명 클래스 내 상관 관계)을 계산하는 방법을 설명하는 이 문서를 보았습니다. R 코드는 다음과 같습니다. #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

1
자유도는 정수가 아닌 숫자 일 수 있습니까?
GAM을 사용할 때 잔여 DF는 (코드의 마지막 줄). 그게 무슨 뜻이야? GAM 예제를 넘어 서면 일반적으로 자유도는 정수가 아닌 숫자 일 수 있습니까?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.