통계 및 빅 데이터 small-sample

7

작은 샘플에서 Wilcoxon과 같은 t- 테스트 또는 비모수 테스트 중에서 선택하는 방법

특정 가설은 스튜던트 t- 검정 (2 샘플 경우 불균형 변동에 대한 Welch의 보정을 사용하여)을 사용하거나 Wilcoxon 대응 부호 순위 검정 인 Wilcoxon-Mann-Whitney U 검정과 같은 비모수 검정을 사용하여 검정 할 수 있습니다. 또는 쌍 부호 테스트. 우리는 어떻게 할 수 원칙 시험은 표본의 크기는 "작은"특히 경우, 가장 적합한 인에 대한 …

96 hypothesis-testing t-test nonparametric small-sample wilcoxon-mann-whitney

4

부트 스트랩을 작은 샘플 크기의 "치료"로 볼 수 있습니까?

이 질문은이 대학원 수준의 통계 교과서에서 읽은 내용과 통계 세미나 에서이 프레젠테이션 중에 들었던 내용에 의해 유발되었습니다. 두 경우 모두,이 문장은 "샘플 크기가 매우 작기 때문에이 파라 메트릭 방법 대신 부트 스트랩을 통해 추정을 수행하기로 결정했습니다 .XXX 그들은 세부 사항을 얻지 못했지만 아마도 추론은 다음과 같습니다. 방법 는 데이터가 특정 …

71 bootstrap small-sample

5

표본 크기 1에서 모집단 평균에 대해 무엇을 말할 수 있습니까?

아무튼 나는 인구 평균에 대해, 우리가 말할 수있는 궁금, 내가 가진 모두가 하나 개의 측정이다 (1 샘플 크기). 분명히, 우리는 더 많은 측정을 원하지만, 얻을 수는 없습니다.y 1μμ\mu와이1y1y_1 이는 표본 평균 때문에, 저 보인다 , 사소하다 동일 그리고, . 그러나 표본 크기가 1이면 표본 분산이 정의되지 않으므로 의 추정값으로 를 …

43 mean sample-size small-sample unbiased-estimator

5

R의 경고-카이 제곱 근사가 잘못되었을 수 있습니다.

소방관 입학 시험 결과를 보여주는 데이터가 있습니다. 시험 결과와 민족이 서로 독립적이지 않다는 가설을 테스트하고 있습니다. 이를 테스트하기 위해 R에서 Pearson 카이 제곱 테스트를 실행했습니다. 결과에 예상 한 결과가 표시되지만 ""라는 경고가 표시되었습니다 In chisq.test(a) : Chi-squared approximation may be incorrect. > a white black asian hispanic pass 5 2 …

40 r categorical-data chi-squared small-sample error-message

6

짧은 시계열을위한 최상의 방법

짧은 시계열 모델링과 관련하여 질문이 있습니다. 그것들을 모델링 해야하는지에 대한 질문은 아니지만 어떻게 해야 합니까? 짧은 시계열 모델링 (길이 )에 어떤 방법을 추천 하시겠습니까? "최고"라는 말은 여기서 가장 강력한 것을 의미합니다. 즉, 제한된 수의 관측 사실로 인해 오류가 발생하기 쉽습니다. 일련의 짧은 단일 관측치가 예측에 영향을 줄 수 있으므로이 방법은 …

35 time-series forecasting small-sample

4

표본 크기, 표본 평균 및 모집단 평균만으로 스튜던트 t- 검정을 수행하는 방법은 알려져 있습니까?

스튜던트 에는 표본 표준 편차 가 필요합니다 . 그러나 표본 크기와 표본 평균 만 알려진 경우 어떻게 계산 합니까?tttssssss 예를 들어, 표본 크기가 이고 표본 평균이 이면 각각 값을 가진 개의 동일한 표본 목록을 만들려고합니다 . 샘플 표준 편차는 입니다. 테스트 에서 0으로 나누기 문제가 발생합니다 .494949112112112494949112112112000ttt 추가 자료 : …

28 t-test standard-deviation small-sample

2

소 표본 연구에서 탐색 적 데이터 분석 및 데이터 준설에 대처하는 방법은 무엇입니까?

탐색 적 데이터 분석 (EDA)은 종종 초기 가설 세트에 속하지 않는 다른 "트랙"을 탐색하게한다. 나는 제한된 표본 크기와 다른 설문지 (사회 인구 통계학 데이터, 신경 심리학 또는 의료 규모-정신 또는 신체 기능, 우울증 / 불안 수준, 증상 검사 목록)를 통해 수집 된 많은 데이터를 가진 연구의 경우 그러한 상황에 직면합니다. …

25 multiple-comparisons epidemiology small-sample eda

2

주제 모델의 주제 안정성

일련의 개방형 에세이의 내용에 대한 정보를 추출하려는 프로젝트를 진행 중입니다. 이 특정 프로젝트에서 148 명이 더 큰 실험의 일환으로 가상의 학생 조직에 대한 에세이를 썼습니다. 내 분야 (사회 심리학)에서 이러한 데이터를 분석하는 일반적인 방법은 수필로 수필을 코딩하는 것이지만 수작업으로 코딩하는 것은 노동 집약적이며 너무 주관적이기 때문에 정량적으로 수행하고 싶습니다. 미각. …

23 machine-learning model-selection small-sample topic-models dirichlet-process

6

작은 샘플에 대한 적절한 정규성 테스트

지금까지 작은 표본의 정규성 가정을 테스트하기 위해 Shapiro-Wilk 통계를 사용했습니다. 다른 기술을 추천 해 주시겠습니까?

22 hypothesis-testing goodness-of-fit normality-assumption small-sample

2

작은 표본 크기로 인해 유형 1 오류가 발생할 수 있습니까?

표본 크기가 작 으면 검정력이 충분하지 않고 유형 2 오류가 발생할 수 있음을 알게되었습니다. 그러나 작은 샘플은 일반적으로 신뢰할 수 없으며 우연히 어떤 종류의 결과로 이어질 수 있다고 생각합니다. 그게 사실입니까?

21 hypothesis-testing small-sample

4

엣지 케이스의 정밀도 및 리콜에 대한 올바른 값은 무엇입니까?

정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …

20 precision-recall data-visualization logarithm references r networks data-visualization standard-deviation probability binomial negative-binomial r categorical-data aggregation plyr survival python regression r t-test bayesian logistic data-transformation confidence-interval t-test interpretation distributions data-visualization pca genetics r finance maximum probability standard-deviation probability r information-theory references computational-statistics computing references engineering-statistics t-test hypothesis-testing independence definition r censoring negative-binomial poisson-distribution variance mixed-model correlation intraclass-correlation aggregation interpretation effect-size hypothesis-testing goodness-of-fit normality-assumption small-sample distributions regression normality-assumption t-test anova confidence-interval z-statistic finance hypothesis-testing mean model-selection information-geometry bayesian frequentist terminology type-i-and-ii-errors cross-validation smoothing splines data-transformation normality-assumption variance-stabilizing r spss stata python correlation logistic logit link-function regression predictor pca factor-analysis r bayesian maximum-likelihood mcmc conditional-probability statistical-significance chi-squared proportion estimation error shrinkage application steins-phenomenon

1

H0에서 부트 스트랩을 사용하여 두 가지 방법의 차이에 대한 테스트 수행 : 그룹 내 또는 풀링 된 샘플 내에서 교체

두 개의 독립적 그룹이있는 데이터가 있다고 가정하십시오. g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50, 81.74) group = rep (c ("g1", "g2"), c (length (g1.lengths), …

18 r hypothesis-testing bootstrap small-sample permutation-test

6

표본 크기가 작은 경우 t- 검정의 중요한 결과를 신뢰할 수 있습니까?

단면 t- 검정 결과가 중요하지만 표본 크기가 작은 경우 (예 : 20 이하)이 결과를 여전히 신뢰할 수 있습니까? 그렇지 않다면 어떻게이 결과를 다루거나 해석해야합니까?

17 statistical-significance t-test interpretation sample-size small-sample

8

짝을 이루지 않은 t- 검정의 최소 표본 크기

t- 검정이 유효하기 위해 필요한 최소 샘플 크기를 결정하는 "규칙"이 있습니까? 예를 들어, 두 모집단의 평균을 비교해야합니다. 한 모집단의 데이터 포인트는 7 개이고 다른 데이터 포인트의 데이터 포인트는 2 개뿐입니다. 불행히도 실험은 비용이 많이 들고 시간이 많이 걸리며 더 많은 데이터를 얻는 것은 불가능합니다. t- 검정을 사용할 수 있습니까? 그 …

16 t-test sample-size small-sample wilcoxon-mann-whitney

2

교차 검증에서 평균 (점수) vs 점수 (연결)

TLDR : 내 데이터 세트는 매우 작은 (120) 샘플입니다. 10 배 교차 검증을 수행하는 동안 다음을 수행해야합니다. 각 테스트 폴드에서 출력을 수집하여 벡터로 연결 한 다음이 전체 예측 벡터 (120 개 샘플)에 대한 오류를 계산합니까? 또는 대신 각 겹 에서 얻은 출력 (폴드 당 12 샘플)의 오류를 계산 한 다음 …

15 classification cross-validation small-sample

«small-sample» 태그된 질문