«multiple-comparisons» 태그된 질문

하나 이상의 가설 검정을 수행 할 때 의도 한 검정력과 크기를 달성해야하는 상황을 알립니다.

1
40,000 개의 신경 과학 논문이 잘못되었을 수 있습니다
나는 이코노미스트 에서이 논문이 "40,000 개의 출판 된 [fMRI] 연구와 같은 것"에 대한 의심을 불러 일으키는 논문 에 대해 보았다 . 그들은 오류는 "잘못된 통계적 가정"때문이라고 말한다. 나는 논문을 읽고 그것이 여러 비교 수정에 문제가 있다는 것을 알지만 fMRI 전문가가 아니며 따르기가 어렵다는 것을 알았습니다. 저자가 말한 잘못된 가정은 무엇인가 …

4
보고 당신은 찾을 것이다 (상관)
수백 개의 측정 값이 있습니다. 이제 모든 측정 값을 모든 측정 값과 연관시키기 위해 일종의 소프트웨어를 사용하는 것을 고려하고 있습니다. 이는 수천 개의 상관 관계가 있음을 의미합니다. 이 중 데이터가 완전히 임의적 임에도 불구하고 (통계적으로) 높은 상관 관계가 있어야합니다 (각 측정 값에는 약 100 개의 데이터 포인트 만 있음). 상관 …

5
다중 비교를 위해 다중 회귀 분석에서 p- 값을 조정하는 것이 좋은 생각입니까?
귀하가 서비스에 대한 관련 수요 예측자를 찾으려고하는 사회 과학 연구원 / 경제학자라고 가정 해 봅시다. 수요를 설명하는 2 개의 결과 / 종속 변수가 있습니다 (서비스 예 / 아니오 및 횟수 사용). 이론적으로 수요를 설명 할 수있는 10 개의 예측 변수 / 독립 변수가 있습니다 (예 : 연령, 성별, 소득, 가격, …

3
p- 값을 결합 할 때 왜 평균을 구하지 않습니까?
최근에 p- 값을 결합하는 Fisher의 방법에 대해 배웠습니다. 이는 null 아래 p- 값이 균일 분포를 따르고 저는 천재라고 생각합니다. 그러나 내 질문은 왜 이렇게 복잡한 길을 가고 있습니까? 왜 p- 값의 평균을 사용하고 중심 한계 정리를 사용하지 않는가? 또는 중앙값? 나는이 거대한 계획 뒤에 RA 피셔의 천재를 이해하려고 노력하고 있습니다.− …

5
다중 비교가 왜 문제가됩니까?
다중 비교 에서 실제로 문제가 무엇인지 이해하기가 어렵습니다 . 간단한 비유로 많은 결정을 내리는 사람은 많은 실수를 저지를 것이라고합니다. 따라서 Bonferroni 보정과 같이 매우 보수적 인 예방 조치가 적용 되어이 사람이 가능한 한 실수를 전혀하지 않을 확률을 만듭니다. 그러나 왜 우리 는 잘못된 결정 의 비율 이 아니라 자신이 한 …

5
FDR 제어를위한 일반적인 방법을 사용하기위한 조건으로 "긍정적 종속성"의 의미
Benjamini와 Hochberg 는 FDR (False Discovery Rate)을 제어하기위한 첫 번째 (아직 가장 널리 사용되는) 방법을 개발했습니다. 각기 다른 비교를 위해 P 값을 묶어 시작하고 FDR을 지정된 값 (예 : 10 %)으로 제어하여 "발견"이라고 할 정도로 낮은 값을 결정하려고합니다. 일반적인 방법의 한 가정은 비교 세트가 독립적이거나 "긍정적 의존성"을 가지고 있지만 P …

3
선형 회귀 분석에서의 유의성 모순 : 계수 대 유의 적이 지 않은 전체 F- 통계량에 대한 유의성 t- 검정
4 가지 범주 형 변수 (각 4 수준)와 숫자 출력 사이에 다중 선형 회귀 모델을 적합시킵니다. 내 데이터 세트에는 43 개의 관측치가 있습니다. 회귀는 모든 기울기 계수에 대해 t- 검정 에서 다음 ppp 값을 제공합니다 : .15 , .67 , .27 , .02 . 따라서 4 번째 예측 변수의 계수는 …

3
로지스틱 회귀 95 % 신뢰 구간을 수동으로 계산하는 것과 R에서 confint () 함수를 사용하는 것 사이에 차이가있는 이유는 무엇입니까?
사랑하는 여러분, 제가 설명 할 수없는 이상한 것을 발견했습니다. 요약 : 로지스틱 회귀 모델에서 신뢰 구간을 계산하는 수동 방법과 R 함수 confint()는 다른 결과를 제공합니다. Hosmer & Lemeshow의 Applied Logistic Regression (2 판)을 진행했습니다. 세 번째 장에는 승산 비와 95 % 신뢰 구간을 계산하는 예가 있습니다. R을 사용하면 모델을 쉽게 …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

1
혼합 효과 모델에 대한 다중 비교
혼합 효과 모델을 사용하여 일부 데이터를 분석하려고합니다. 내가 수집 한 데이터는 시간이 지남에 따라 다른 유전자형의 일부 젊은 동물의 무게를 나타냅니다. 나는 여기에 제안 된 접근법을 사용하고 있습니다 : https://gribblelab.wordpress.com/2009/03/09/repeated-measures-anova-using-r/ 특히 솔루션 # 2를 사용하고 있습니다. 그래서 나는 같은 것을 가지고있다. require(nlme) model <- lme(weight ~ time * Genotype, random …

5
데이터 "탐사"와 데이터 "스누핑"/ "고문"?
여러 번 나는 "데이터 스누핑"에 대한 비공식적 인 경고를 겪었으며 (여기서는 재미있는 예가있다 ), 그것이 의미하는 바가 무엇이고 왜 그것이 문제가 될 수 있는지에 대한 직관적 인 생각이 있다고 생각한다. 다른 한편으로, "탐사 데이터 분석"은 적어도 그 제목 을 가진 책 이 여전히 고전적인 것으로 인용 된다는 사실에 의해 판단 …

6
이진 분류를위한 변수 선택 절차
학습 세트의 관측치보다 많은 변수 / 기능이있을 때 이진 분류에 선호 하는 변수 / 기능 선택 은 무엇입니까 ? 여기서 목표는 분류 오류를 최대한 줄이는 기능 선택 절차가 무엇인지 논의하는 것입니다. 우리는 할 수 있습니다 표기법을 수정 일관성을 위해 : 대한 ,하자 수 관찰 학습 세트를 그룹에서 . 따라서 은 …

1
lmer 모델의 효과 반복 계산
방금 혼합 효과 모델링을 통해 측정의 반복성 (일명 신뢰성, 일명 클래스 내 상관 관계)을 계산하는 방법을 설명하는 이 문서를 보았습니다. R 코드는 다음과 같습니다. #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

2
신뢰 구간을 사용할 때 여러 비교 조정을 처리해야합니까?
쌍별 통계에 대한 사후 추론 또는 다중 회귀 와 같은 다중 비교 시나리오가 있다고 가정합니다.mmm합니다. 또한 신뢰 구간을 사용하여 이러한 배수의 추론을 지원한다고 가정합니다. 1. CI에 여러 비교 조정을 적용합니까? 즉, 다중 비교가 αα\alpha 를 재정 의하여 FWER ( family-wise error rate ) 또는 FDR ( False Discovery Rate 신뢰 …

1
R에서 GLM 후 요인 수준 비교
내 상황에 대한 약간의 배경은 다음과 같습니다. 내 데이터는 포식자가 성공적으로 먹은 먹이 수를 나타냅니다. 각 시험에서 먹이의 수가 제한되어 있으므로 (25 개의 이용 가능), 이용 가능한 먹이의 수를 나타내는 "샘플"열 (각 시험에서 25)과 성공 횟수 ( "Count")가 있습니다 ( 먹이를 몇 마리 먹었는지) 비율 데이터 (578 페이지)를 기준으로 R …

2
소 표본 연구에서 탐색 적 데이터 분석 및 데이터 준설에 대처하는 방법은 무엇입니까?
탐색 적 데이터 분석 (EDA)은 종종 초기 가설 세트에 속하지 않는 다른 "트랙"을 탐색하게한다. 나는 제한된 표본 크기와 다른 설문지 (사회 인구 통계학 데이터, 신경 심리학 또는 의료 규모-정신 또는 신체 기능, 우울증 / 불안 수준, 증상 검사 목록)를 통해 수집 된 많은 데이터를 가진 연구의 경우 그러한 상황에 직면합니다. …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.