«sample-size» 태그된 질문

이 태그는 매우 모호합니다. 질문이 표본 크기에 관한 것이며 [소규모 표본], [대량 데이터], [검정력 분석], [검정력], [미정] 또는 [불평형 클래스] 중 어느 것도 더 적합하지 않은 경우에 사용하십시오.

4
주어진 추정 기술과 변수에 대해 표본이 얼마나 커야합니까?
주어진 수의 매개 변수로 모형을 추정하기 위해 표본이 얼마나 큰지를 알려줄 수있는 경험이 있습니까? 예를 들어, 5 개의 모수로 최소 제곱 회귀를 추정하려면 표본의 크기는 얼마입니까? 사용중인 추정 기술 (예 : 최대 가능성, 최소 제곱, GMM) 또는 수행 할 테스트 수 또는 몇 가지가 중요합니까? 결정을 할 때 표본 변동성을 …

1
K를 선택하면 왜 교차 검증 점수가 낮아 집니까?
주변에 재생 보스톤 주택 데이터 집합 와 RandomForestRegressor에 (w / 기본 매개 변수) 나는 이상한 뭔가를 발견, scikit 배우기 : 평균 교차 유효성 검사 점수가 감소 내가 내 교차 검증 전략 등이었다 다음 10 이상으로 주름의 수를 증가로 : cv_met = ShuffleSplit(n_splits=k, test_size=1/k) scores = cross_val_score(est, X, y, cv=cv_met) ... …

1
이 연속 데이터에 부트 스트랩이 적합합니까?
나는 완전한 초보자입니다 :) 약 745,000 명의 인구에서 10,000의 표본 크기로 연구하고 있습니다. 각 샘플은 "백분율 유사성"을 나타냅니다. 대부분의 표본은 약 97 % -98 %이지만 일부는 60 %와 90 % 사이입니다. 즉, 분포가 크게 부정적입니다. 결과의 약 0.6 %는 0 %이지만 샘플과 별도로 처리됩니다. 모든 10,000 샘플의 평균은 97.7 %이며 …

4
연구에 힘이 넘친다는 것은 무엇을 의미합니까?
연구에 힘이 넘친다는 것은 무엇을 의미합니까? 제 인상은 샘플 크기가 너무 커서 마이너 스컬 효과 크기를 감지 할 수 있다는 것입니다. 이러한 효과 크기는 아마도 너무 작아서 변수 사이의 (직접적인 것은 아니지만) 인과 적 연결보다 샘플링 과정에서 약간의 편향으로 인해 발생할 가능성이 높습니다. 이것이 올바른 직관입니까? 그렇다면 결과가 그 빛으로 …

1
클릭률이 가장 높은 광고 세트를 결정하는 데 필요한 샘플 크기
저는 무역 분야의 소프트웨어 디자이너이며 고객을위한 프로젝트를 진행 중이며, 분석이 통계적으로 올바른지 확인하고 싶습니다. 다음을 고려하십시오. n 개의 광고 가 있고 (n <10), 어떤 광고가 가장 실적이 좋은지 알고 싶습니다. Google 광고 서버는 이러한 광고 중 하나를 임의로 게재합니다. 사용자가 광고를 클릭하면 Google 서버에서이를 추적합니다. 주어진 시간 : 신뢰 구간 …

4
일 변량 로지스틱 회귀 분석을위한 표본 크기 계산
피험자들의 코호트가 수술 시점에 단일 연속 변수를 측정 한 다음 2 년 후에 기능적 결과 또는 손상된 결과로 분류되는 연구에 필요한 표본 크기를 어떻게 계산합니까? 측정 결과 나쁜 결과를 예측할 수 있었는지 확인하고 싶습니다. 어떤 시점에서 우리는 연속 변수에서 컷 포인트를 도출하여 그 결과가 손상 될 가능성을 줄이기 위해 개입하려고 …

1
R / mgcv : te () 및 ti () 텐서 제품이 다른 표면을 생성하는 이유는 무엇입니까?
mgcv에 대한 패키지는 R텐서 제품의 상호 작용을 피팅에 대한 두 가지 기능이 있습니다 : te()와 ti(). 나는 둘 사이의 기본 노동 분열을 이해한다 (비선형 상호 작용에 적합하고이 상호 작용을 주요 효과와 상호 작용으로 분해). 내가 이해할 수없는 것은 왜 te(x1, x2)와 ti(x1) + ti(x2) + ti(x1, x2)(약간) 다른 결과가 발생할 …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
SurveyMonkey는 무작위가 아닌 샘플을 받는다는 사실을 무시합니까?
SurveyMonkey에는 모집단 규모에 따라 주어진 오차 한계 또는 신뢰 구간에 필요한 표본 크기를 파악하기위한 단계와 차트가 있습니다. SurveyMonkey 샘플 크기 이 차트는 단순히 무작위 표본을 얻지 못한다는 사실을 무시합니까? 설문 조사에 귀를 기울이는 사람들 만 얻을 수 있기 때문입니까? 이 질문을 입력하면 질문이 주관적인 것처럼 보이므로 제대로 묻지 않을 수 …

2
정밀도 기반 (즉, 역 분산) ​​가중치가 메타 분석에 필수적인가?
정밀 분석 기반 가중치가 메타 분석의 중심입니까? Borenstein et al. (2009)는 메타 분석이 가능하기 위해서는 다음과 같은 것이 필요하다고 썼다. 연구에 따르면 단일 숫자로 표현할 수있는 포인트 추정치가보고됩니다. 해당 포인트 추정치에 대한 분산을 계산할 수 있습니다. 왜 (2)가 엄격하게 필요한지는 분명하지 않습니다. 그러나 실제로 널리 받아 들여진 메타 분석 방법은 …

2
작은 표본 크기 데이터에 대한 훈련, 교차 검증 및 테스트 세트 크기를 선택하는 방법은 무엇입니까?
샘플 크기가 작고 (예 : N = 100) 두 개의 클래스가 있다고 가정합니다. 머신 러닝을위한 교육, 교차 검증 및 테스트 세트 크기를 어떻게 선택해야합니까? 나는 직관적으로 선택합니다 훈련 세트 크기는 50 교차 검증 세트 크기 25 및 테스트 크기는 25입니다. 그러나 아마도 이것은 다소 의미가 있습니다. 이 값들을 어떻게 결정해야합니까? …

2
전체 모집단의 데이터를 사용할 수있을 때 신뢰 구간을 계산하고 가설을 테스트하는 것이 합리적입니까?
전체 모집단의 데이터를 사용할 수있을 때 신뢰 구간을 계산하고 가설을 테스트하는 것이 합리적입니까? 내 의견으로는, 우리는 매개 변수의 실제 값을 정확하게 계산할 수 있기 때문에 대답은 아니오입니다. 그러나 앞서 언급 한 기술을 사용할 수있는 최초 모집단의 최대 데이터 비율은 얼마입니까?

3
귀무 가설이 경우 이항 데이터의 검정력 분석
, 하여 이항 데이터의 단일 표본에 대한 검정력 분석을 수행하려고합니다 여기서 는 모집단의 성공 비율입니다. 경우 , I는 이항 법선 근사하거나 또는 사용할 수 -test하지만과 이 모두 실패한다. 이 분석을 수행 할 수있는 방법이 있는지 알고 싶습니다. 제안, 의견 또는 언급이 있으면 대단히 감사하겠습니다. 많은 감사합니다!H0:p=0H0:p=0H_0: p = 0H1:p=0.001H1:p=0.001H_1: p …

1
Anova ()와 drop1 ()이 GLMM에 다른 답변을 제공 한 이유는 무엇입니까?
GLMM 형식이 있습니다. lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 를 사용할 때 자동차 패키지 또는에서 사용할 때 drop1(model, test="Chi")와 다른 결과를 얻습니다 . 후자의 두 사람도 같은 대답을합니다.Anova(model, type="III")summary(model) 조작 된 데이터를 사용 하여이 두 가지 방법이 일반적으로 다르지 않다는 것을 알았습니다. …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
표준 오류 (SE)를 사용하지 않는 대체 깔때기 플롯
메타 분석을 제출하기 전에 이질성과 게시 편견을 테스트하기위한 퍼널 플롯을 만들고 싶습니다. 각 연구에서 풀링 된 효과 크기와 효과 크기를 가지고 있는데,이 값은 -1에서 +1까지입니다. 각 연구의 환자 및 대조군에 대해 표본 크기 n1, n2가 있습니다. 표준 오차 (SE)를 계산할 수 없으므로 Egger의 회귀를 수행 할 수 없습니다. 세로 축에 …

2
랜덤 효과 모델에서 클러스터 당 최소 샘플 크기
랜덤 효과 모델에서 군집 당 관측치 수에 대한 합리성이 있습니까? 교환 가능한 임의 효과로 모델링 된 700 개의 클러스터를 사용하여 샘플 크기가 1,500입니다. 더 적지 만 더 큰 클러스터를 구축하기 위해 클러스터를 병합하는 옵션이 있습니다. 각 클러스터의 랜덤 효과를 예측할 때 의미있는 결과를 얻기 위해 클러스터 당 최소 샘플 크기를 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.