«small-sample» 태그된 질문

적은 데이터로 인한 통계적 합병증 또는 문제를 나타냅니다. 귀하의 질문이 변수의 수에 비해 작은 샘플에 관한 것이라면 [underdetermined] 태그를 대신 사용하십시오.

7
작은 샘플에서 Wilcoxon과 같은 t- 테스트 또는 비모수 테스트 중에서 선택하는 방법
특정 가설은 스튜던트 t- 검정 (2 샘플 경우 불균형 변동에 대한 Welch의 보정을 사용하여)을 사용하거나 Wilcoxon 대응 부호 순위 검정 인 Wilcoxon-Mann-Whitney U 검정과 같은 비모수 검정을 사용하여 검정 할 수 있습니다. 또는 쌍 부호 테스트. 우리는 어떻게 할 수 원칙 시험은 표본의 크기는 "작은"특히 경우, 가장 적합한 인에 대한 …

4
부트 스트랩을 작은 샘플 크기의 "치료"로 볼 수 있습니까?
이 질문은이 대학원 수준의 통계 교과서에서 읽은 내용과 통계 세미나 에서이 프레젠테이션 중에 들었던 내용에 의해 유발되었습니다. 두 경우 모두,이 문장은 "샘플 크기가 매우 작기 때문에이 파라 메트릭 방법 대신 부트 스트랩을 통해 추정을 수행하기로 결정했습니다 .XXX 그들은 세부 사항을 얻지 못했지만 아마도 추론은 다음과 같습니다. 방법 는 데이터가 특정 …

5
표본 크기 1에서 모집단 평균에 대해 무엇을 말할 수 있습니까?
아무튼 나는 인구 평균에 대해, 우리가 말할 수있는 궁금, 내가 가진 모두가 하나 개의 측정이다 (1 샘플 크기). 분명히, 우리는 더 많은 측정을 원하지만, 얻을 수는 없습니다.y 1μμ\mu와이1y1y_1 이는 표본 평균 때문에, 저 보인다 , 사소하다 동일 그리고, . 그러나 표본 크기가 1이면 표본 분산이 정의되지 않으므로 의 추정값으로 를 …

5
R의 경고-카이 제곱 근사가 잘못되었을 수 있습니다.
소방관 입학 시험 결과를 보여주는 데이터가 있습니다. 시험 결과와 민족이 서로 독립적이지 않다는 가설을 테스트하고 있습니다. 이를 테스트하기 위해 R에서 Pearson 카이 제곱 테스트를 실행했습니다. 결과에 예상 한 결과가 표시되지만 ""라는 경고가 표시되었습니다 In chisq.test(a) : Chi-squared approximation may be incorrect. > a white black asian hispanic pass 5 2 …

6
짧은 시계열을위한 최상의 방법
짧은 시계열 모델링과 관련하여 질문이 있습니다. 그것들을 모델링 해야하는지에 대한 질문은 아니지만 어떻게 해야 합니까? 짧은 시계열 모델링 (길이 )에 어떤 방법을 추천 하시겠습니까? "최고"라는 말은 여기서 가장 강력한 것을 의미합니다. 즉, 제한된 수의 관측 사실로 인해 오류가 발생하기 쉽습니다. 일련의 짧은 단일 관측치가 예측에 영향을 줄 수 있으므로이 방법은 …

4
표본 크기, 표본 평균 및 모집단 평균만으로 스튜던트 t- 검정을 수행하는 방법은 알려져 있습니까?
스튜던트 에는 표본 표준 편차 가 필요합니다 . 그러나 표본 크기와 표본 평균 만 알려진 경우 어떻게 계산 합니까?tttssssss 예를 들어, 표본 크기가 이고 표본 평균이 이면 각각 값을 가진 개의 동일한 표본 목록을 만들려고합니다 . 샘플 표준 편차는 입니다. 테스트 에서 0으로 나누기 문제가 발생합니다 .494949112112112494949112112112000ttt 추가 자료 : …

2
소 표본 연구에서 탐색 적 데이터 분석 및 데이터 준설에 대처하는 방법은 무엇입니까?
탐색 적 데이터 분석 (EDA)은 종종 초기 가설 세트에 속하지 않는 다른 "트랙"을 탐색하게한다. 나는 제한된 표본 크기와 다른 설문지 (사회 인구 통계학 데이터, 신경 심리학 또는 의료 규모-정신 또는 신체 기능, 우울증 / 불안 수준, 증상 검사 목록)를 통해 수집 된 많은 데이터를 가진 연구의 경우 그러한 상황에 직면합니다. …

2
주제 모델의 주제 안정성
일련의 개방형 에세이의 내용에 대한 정보를 추출하려는 프로젝트를 진행 중입니다. 이 특정 프로젝트에서 148 명이 더 큰 실험의 일환으로 가상의 학생 조직에 대한 에세이를 썼습니다. 내 분야 (사회 심리학)에서 이러한 데이터를 분석하는 일반적인 방법은 수필로 수필을 코딩하는 것이지만 수작업으로 코딩하는 것은 노동 집약적이며 너무 주관적이기 때문에 정량적으로 수행하고 싶습니다. 미각. …



4
엣지 케이스의 정밀도 및 리콜에 대한 올바른 값은 무엇입니까?
정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

1
H0에서 부트 스트랩을 사용하여 두 가지 방법의 차이에 대한 테스트 수행 : 그룹 내 또는 풀링 된 샘플 내에서 교체
두 개의 독립적 그룹이있는 데이터가 있다고 가정하십시오. g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50, 81.74) group = rep (c ("g1", "g2"), c (length (g1.lengths), …


8
짝을 이루지 않은 t- 검정의 최소 표본 크기
t- 검정이 유효하기 위해 필요한 최소 샘플 크기를 결정하는 "규칙"이 있습니까? 예를 들어, 두 모집단의 평균을 비교해야합니다. 한 모집단의 데이터 포인트는 7 개이고 다른 데이터 포인트의 데이터 포인트는 2 개뿐입니다. 불행히도 실험은 비용이 많이 들고 시간이 많이 걸리며 더 많은 데이터를 얻는 것은 불가능합니다. t- 검정을 사용할 수 있습니까? 그 …

2
교차 검증에서 평균 (점수) vs 점수 (연결)
TLDR : 내 데이터 세트는 매우 작은 (120) 샘플입니다. 10 배 교차 검증을 수행하는 동안 다음을 수행해야합니다. 각 테스트 폴드에서 출력을 수집하여 벡터로 연결 한 다음이 전체 예측 벡터 (120 개 샘플)에 대한 오류를 계산합니까? 또는 대신 각 겹 에서 얻은 출력 (폴드 당 12 샘플)의 오류를 계산 한 다음 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.