«sample-size» 태그된 질문

이 태그는 매우 모호합니다. 질문이 표본 크기에 관한 것이며 [소규모 표본], [대량 데이터], [검정력 분석], [검정력], [미정] 또는 [불평형 클래스] 중 어느 것도 더 적합하지 않은 경우에 사용하십시오.

1
분산의 샘플링 분포가 카이 제곱 분포 인 이유는 무엇입니까?
진술 표본 분산의 표본 분포는 자유도가 n−1n−1n-1 인 카이 제곱 분포입니다 . 여기서nnn 은 표본 크기입니다 (관심있는 임의의 변수가 정규 분포를 따르는 경우). 출처 내 직감 1) 카이 제곱 테스트는 제곱합처럼 보이기 때문에 2) 카이 제곱 분포는 제곱 정규 분포의 합이기 때문에 다소 직관적입니다. 그러나 여전히, 나는 그것을 잘 이해하지 …

1
5 명의 대상에 대한 100 개의 측정 값이 100 명의 대상에 대한 5 개의 측정 값보다 훨씬 적은 정보를 제공함을 보여줍니다.
회의에서 나는 다음 진술을 들었다. 5 명의 피험자에 대한 100 회 측정은 100 명의 피험자에 대한 5 회 측정보다 훨씬 적은 정보를 제공합니다. 이것이 사실이라는 것은 분명하지만, 어떻게 수학적으로 증명할 수 있는지 궁금합니다. 선형 혼합 모델을 사용할 수 있다고 생각합니다. 그러나 나는 그것들을 추정하는 데 사용되는 수학에 대해 많이 모른다. …

4
PCA 공간에 새로운 벡터를 투영하는 방법?
주성분 분석 (PCA)을 수행 한 후 PCA 공간에 새 벡터를 투영하려고합니다 (즉, PCA 좌표계에서 해당 좌표를 찾습니다). 를 사용하여 R 언어로 PCA를 계산했습니다 prcomp. 이제 내 벡터에 PCA 회전 행렬을 곱할 수 있어야합니다. 이 매트릭스의 주요 구성 요소를 행 또는 열로 배열해야합니까?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

3
중앙 한계 정리에 큰 표본 크기가 필요한 분포의 예
일부 책은 중앙 한계 정리가 대한 근사치를 제공하기 위해 크기가 30 이상인 표본 크기가 필요하다고 명시합니다 . 엑스¯엑스¯\bar{X} 이것이 모든 배포에 충분하지 않다는 것을 알고 있습니다. 큰 표본 크기 (아마도 100 또는 1000 이상)에서도 표본 평균의 분포가 여전히 치우친 분포의 일부 예를보고 싶습니다. 나는 이전에 그러한 예를 보았지만 어디에서 찾을 …

1
크기 1과 3의 두 샘플을 비교하기위한 통계 테스트가 있습니까?
생태학 프로젝트를 위해 저의 실험실 그룹은 같은 양의 연못 물을 포함하는 4 개의 탱크, 1 개의 수생 식물 (수생 식물)이없는 대조군 및 각각의 동일한 양의 1 개의 수처리 식물로 3 개의 처리에 식초를 첨가했습니다. 식초를 첨가하는 목적은 pH를 낮추는 것이 었습니다. elodea가있는 탱크는 정상 pH로 더 빨리 돌아갈 것이라는 가설이있었습니다. …

1
표본 크기를 임의 변수로 만드는 것은 무엇을 의미합니까?
Frank Harrell 님이 블로그 ( Statistical Thinking)를 시작했습니다 . 그의에서 최고의 후 , 그는 자신의 통계 철학의 몇 가지 주요 기능을 나열합니다. 다른 항목들에는 다음이 포함됩니다. 가능하면 표본 크기를 임의 변수로 설정 "샘플 크기를 임의의 변수로 만든다"는 것은 무엇을 의미합니까? 이 작업의 장점은 무엇입니까? 왜 바람직할까요?



4
필요한 표본 크기, 분산 추정 정확도를 계산합니까?
배경 분포를 알 수없는 변수가 있습니다. 500 개의 샘플이 있지만 분산을 계산할 수있는 정밀도 (예 : 500의 샘플 크기가 충분 함)를 보여주고 싶습니다. 또한 정밀도 의 분산을 추정하는 데 필요한 최소 샘플 크기를 알고 싶습니다 X%X%X\%. 질문 계산하는 방법 표본 크기가 인 경우 분산 추정치의 정밀도는 n=500n=500n=500? 의 n=Nn=Nn=N ? …

8
짝을 이루지 않은 t- 검정의 최소 표본 크기
t- 검정이 유효하기 위해 필요한 최소 샘플 크기를 결정하는 "규칙"이 있습니까? 예를 들어, 두 모집단의 평균을 비교해야합니다. 한 모집단의 데이터 포인트는 7 개이고 다른 데이터 포인트의 데이터 포인트는 2 개뿐입니다. 불행히도 실험은 비용이 많이 들고 시간이 많이 걸리며 더 많은 데이터를 얻는 것은 불가능합니다. t- 검정을 사용할 수 있습니까? 그 …

2
대규모 데이터 세트에 대한 유의 수준을 선택하는 방법은 무엇입니까?
N이 약 200,000 인 데이터 세트로 작업하고 있습니다. 회귀에서, 매우 작은 효과 크기와 관련된 매우 작은 유의성 값 << 0.001, 예를 들어 r = 0.028을보고 있습니다. 내가 알고 싶은 것은 표본 크기와 관련하여 적절한 유의성 임계 값을 결정하는 원칙적인 방법이 있습니까? 이러한 큰 샘플로 효과 크기를 해석 할 때 고려해야 …

3
대규모 모집단을 폴링 할 때 표본 크기를 어떻게 결정합니까?
호주는 현재 선거를 진행하고 있으며 언론은 매일 새로운 정치 여론 조사 결과를보고합니다. 통계적으로 유효한 결과를 얻으려면 2,200 만 명의 국가에서 인구의 몇 퍼센트를 샘플링해야합니까? 너무 큰 샘플을 사용하면 결과에 영향을 줄 수 있습니까, 아니면 샘플 크기에 따라 통계적 유효성이 단조 증가합니까?

3
부트 스트랩 : 과적 합 문제
대체로 원래 관측치 로부터 각각 크기 의 샘플을 추출 하여 소위 비모수 적 부트 스트랩을 수행한다고 가정합니다 . 이 절차는 경험적인 cdf에 의한 누적 분포 함수를 추정하는 것과 같습니다.BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function 그리고 추정 된 cdf 시간 으로부터 관측치를 연속 으로 시뮬레이션함으로써 부트 스트랩 샘플을 획득하는 단계 를 포함한다.nnnBBB 내가 이것에 옳다면 …

2
동일하지 않은 샘플 크기 : 호출시기 종료
나는 학술 저널 기사를 검토하고 저자는 추론 통계를보고하지 않은 것에 대한 정당화로 다음을 썼습니다 (나는 두 그룹의 본질을 알지 못했습니다). 총 2,349 명 (1.1 %)의 25 명은 X를 보고했습니다 . 우리는 그룹 X 와 그룹 Y (다른 2,324 명 참여자) 를 통계적으로 비교하는 분석을 제시하지 않는 것이 적절 하다. 내 …

7
짧은 시계열이 모델링 가치가 있습니까?
여기 몇 가지 맥락이 있습니다. 두 가지 환경 변수 (온도, 영양소 수준)가 11 년 동안 반응 변수의 평균 값에 어떤 영향을 미치는지 결정하고 싶습니다. 매년 1 억 개가 넘는 위치의 데이터가 있습니다. 목표는 11 년 동안 반응 변수의 평균값이 환경 변수의 변화에 ​​반응했는지 여부를 결정하는 것입니다 (예 : 더 따뜻한 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.