통계 및 빅 데이터 sample-size

1

진술 표본 분산의 표본 분포는 자유도가 n−1n−1n-1 인 카이 제곱 분포입니다 . 여기서nnn 은 표본 크기입니다 (관심있는 임의의 변수가 정규 분포를 따르는 경우). 출처 내 직감 1) 카이 제곱 테스트는 제곱합처럼 보이기 때문에 2) 카이 제곱 분포는 제곱 정규 분포의 합이기 때문에 다소 직관적입니다. 그러나 여전히, 나는 그것을 잘 이해하지 …

22 distributions normal-distribution sampling chi-squared sample-size

1

5 명의 대상에 대한 100 개의 측정 값이 100 명의 대상에 대한 5 개의 측정 값보다 훨씬 적은 정보를 제공함을 보여줍니다.

회의에서 나는 다음 진술을 들었다. 5 명의 피험자에 대한 100 회 측정은 100 명의 피험자에 대한 5 회 측정보다 훨씬 적은 정보를 제공합니다. 이것이 사실이라는 것은 분명하지만, 어떻게 수학적으로 증명할 수 있는지 궁금합니다. 선형 혼합 모델을 사용할 수 있다고 생각합니다. 그러나 나는 그것들을 추정하는 데 사용되는 수학에 대해 많이 모른다. …

21 mixed-model variance repeated-measures sample-size intraclass-correlation

4

PCA 공간에 새로운 벡터를 투영하는 방법?

주성분 분석 (PCA)을 수행 한 후 PCA 공간에 새 벡터를 투영하려고합니다 (즉, PCA 좌표계에서 해당 좌표를 찾습니다). 를 사용하여 R 언어로 PCA를 계산했습니다 prcomp. 이제 내 벡터에 PCA 회전 행렬을 곱할 수 있어야합니다. 이 매트릭스의 주요 구성 요소를 행 또는 열로 배열해야합니까?

21 r pca r variance heteroscedasticity misspecification distributions time-series data-visualization modeling histogram kolmogorov-smirnov negative-binomial likelihood-ratio econometrics panel-data categorical-data scales survey distributions pdf histogram correlation algorithms r gpu parallel-computing approximation mean median references sample-size normality-assumption central-limit-theorem rule-of-thumb confidence-interval estimation mixed-model psychometrics random-effects-model hypothesis-testing sample-size dataset large-data regression standard-deviation variance approximation hypothesis-testing variance central-limit-theorem kernel-trick kernel-smoothing error sampling hypothesis-testing normality-assumption philosophical confidence-interval modeling model-selection experiment-design hypothesis-testing statistical-significance power asymptotics information-retrieval anova multiple-comparisons ancova classification clustering factor-analysis psychometrics r sampling expectation-maximization markov-process r data-visualization correlation regression statistical-significance degrees-of-freedom experiment-design r regression curve-fitting change-point loess machine-learning classification self-study monte-carlo markov-process references mathematical-statistics data-visualization python cart boosting regression classification robust cart survey binomial psychometrics likert psychology asymptotics multinomial

3

중앙 한계 정리에 큰 표본 크기가 필요한 분포의 예

일부 책은 중앙 한계 정리가 대한 근사치를 제공하기 위해 크기가 30 이상인 표본 크기가 필요하다고 명시합니다 . 엑스¯엑스¯\bar{X} 이것이 모든 배포에 충분하지 않다는 것을 알고 있습니다. 큰 표본 크기 (아마도 100 또는 1000 이상)에서도 표본 평균의 분포가 여전히 치우친 분포의 일부 예를보고 싶습니다. 나는 이전에 그러한 예를 보았지만 어디에서 찾을 …

19 mean sample-size normality-assumption central-limit-theorem

1

크기 1과 3의 두 샘플을 비교하기위한 통계 테스트가 있습니까?

생태학 프로젝트를 위해 저의 실험실 그룹은 같은 양의 연못 물을 포함하는 4 개의 탱크, 1 개의 수생 식물 (수생 식물)이없는 대조군 및 각각의 동일한 양의 1 개의 수처리 식물로 3 개의 처리에 식초를 첨가했습니다. 식초를 첨가하는 목적은 pH를 낮추는 것이 었습니다. elodea가있는 탱크는 정상 pH로 더 빨리 돌아갈 것이라는 가설이있었습니다. …

19 hypothesis-testing t-test sample-size

1

표본 크기를 임의 변수로 만드는 것은 무엇을 의미합니까?

Frank Harrell 님이 블로그 ( Statistical Thinking)를 시작했습니다 . 그의에서 최고의 후 , 그는 자신의 통계 철학의 몇 가지 주요 기능을 나열합니다. 다른 항목들에는 다음이 포함됩니다. 가능하면 표본 크기를 임의 변수로 설정 "샘플 크기를 임의의 변수로 만든다"는 것은 무엇을 의미합니까? 이 작업의 장점은 무엇입니까? 왜 바람직할까요?

18 sample-size random-variable regression-strategies

6

표본 크기가 작은 경우 t- 검정의 중요한 결과를 신뢰할 수 있습니까?

단면 t- 검정 결과가 중요하지만 표본 크기가 작은 경우 (예 : 20 이하)이 결과를 여전히 신뢰할 수 있습니까? 그렇지 않다면 어떻게이 결과를 다루거나 해석해야합니까?

17 statistical-significance t-test interpretation sample-size small-sample

2

표본 크기와 후방에 대한 이전의 영향 사이의 관계는 무엇입니까?

표본 크기가 작 으면 이전 분포가 후방 분포에 많은 영향을 미칩니 까?

17 bayesian sample-size prior

4

필요한 표본 크기, 분산 추정 정확도를 계산합니까?

배경 분포를 알 수없는 변수가 있습니다. 500 개의 샘플이 있지만 분산을 계산할 수있는 정밀도 (예 : 500의 샘플 크기가 충분 함)를 보여주고 싶습니다. 또한 정밀도 의 분산을 추정하는 데 필요한 최소 샘플 크기를 알고 싶습니다 X%X%X\%. 질문 계산하는 방법 표본 크기가 인 경우 분산 추정치의 정밀도는 n=500n=500n=500? 의 n=Nn=Nn=N ? …

17 estimation random-variable variance sampling sample-size

8

짝을 이루지 않은 t- 검정의 최소 표본 크기

t- 검정이 유효하기 위해 필요한 최소 샘플 크기를 결정하는 "규칙"이 있습니까? 예를 들어, 두 모집단의 평균을 비교해야합니다. 한 모집단의 데이터 포인트는 7 개이고 다른 데이터 포인트의 데이터 포인트는 2 개뿐입니다. 불행히도 실험은 비용이 많이 들고 시간이 많이 걸리며 더 많은 데이터를 얻는 것은 불가능합니다. t- 검정을 사용할 수 있습니까? 그 …

16 t-test sample-size small-sample wilcoxon-mann-whitney

2

대규모 데이터 세트에 대한 유의 수준을 선택하는 방법은 무엇입니까?

N이 약 200,000 인 데이터 세트로 작업하고 있습니다. 회귀에서, 매우 작은 효과 크기와 관련된 매우 작은 유의성 값 << 0.001, 예를 들어 r = 0.028을보고 있습니다. 내가 알고 싶은 것은 표본 크기와 관련하여 적절한 유의성 임계 값을 결정하는 원칙적인 방법이 있습니까? 이러한 큰 샘플로 효과 크기를 해석 할 때 고려해야 …

15 regression probability statistical-significance sample-size

3

대규모 모집단을 폴링 할 때 표본 크기를 어떻게 결정합니까?

호주는 현재 선거를 진행하고 있으며 언론은 매일 새로운 정치 여론 조사 결과를보고합니다. 통계적으로 유효한 결과를 얻으려면 2,200 만 명의 국가에서 인구의 몇 퍼센트를 샘플링해야합니까? 너무 큰 샘플을 사용하면 결과에 영향을 줄 수 있습니까, 아니면 샘플 크기에 따라 통계적 유효성이 단조 증가합니까?

15 sample-size polling

3

부트 스트랩 : 과적 합 문제

대체로 원래 관측치 로부터 각각 크기 의 샘플을 추출 하여 소위 비모수 적 부트 스트랩을 수행한다고 가정합니다 . 이 절차는 경험적인 cdf에 의한 누적 분포 함수를 추정하는 것과 같습니다.BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function 그리고 추정 된 cdf 시간 으로부터 관측치를 연속 으로 시뮬레이션함으로써 부트 스트랩 샘플을 획득하는 단계 를 포함한다.nnnBBB 내가 이것에 옳다면 …

14 bootstrap sample-size sample small-sample finite-population

2

동일하지 않은 샘플 크기 : 호출시기 종료

나는 학술 저널 기사를 검토하고 저자는 추론 통계를보고하지 않은 것에 대한 정당화로 다음을 썼습니다 (나는 두 그룹의 본질을 알지 못했습니다). 총 2,349 명 (1.1 %)의 25 명은 X를 보고했습니다 . 우리는 그룹 X 와 그룹 Y (다른 2,324 명 참여자) 를 통계적으로 비교하는 분석을 제시하지 않는 것이 적절 하다. 내 …

14 hypothesis-testing sample-size power-analysis power group-differences

7

짧은 시계열이 모델링 가치가 있습니까?

여기 몇 가지 맥락이 있습니다. 두 가지 환경 변수 (온도, 영양소 수준)가 11 년 동안 반응 변수의 평균 값에 어떤 영향을 미치는지 결정하고 싶습니다. 매년 1 억 개가 넘는 위치의 데이터가 있습니다. 목표는 11 년 동안 반응 변수의 평균값이 환경 변수의 변화에 반응했는지 여부를 결정하는 것입니다 (예 : 더 따뜻한 …

14 time-series regression sample-size small-sample

«sample-size» 태그된 질문