«statistical-significance» 태그된 질문

통계적 유의성은이 표본을 추출한 모집단에서 실제 효과가 0 (또는 일부 가정 된 값) 인 경우 표본에서 얻은 것보다 극한이거나 극단적 인 검정 통계량이 발생할 가능성을 나타냅니다.


3
쌍별 t- 검정이없는 경우 분산 분석이 유의할 수 있습니까?
쌍별 t- 검정이 없는 경우 일원 ( 그룹 또는 "수준") 분산 분석에서 유의미한 차이를보고 할 수 있습니까?N ( N - 1 ) / 2N>2N>2N>2N(N−1)/2N(N−1)/2N(N-1)/2 에서 이 응답 @whuber 썼다 : 글로벌 ANOVA F 검정은 어떤 쌍의 수단에 대한 개별적인 [조정되지 않은 쌍별] t- 검정이 유의미한 결과를 산출하지 않는 경우에도 평균의 …

1
lmer 모델의 효과 반복 계산
방금 혼합 효과 모델링을 통해 측정의 반복성 (일명 신뢰성, 일명 클래스 내 상관 관계)을 계산하는 방법을 설명하는 이 문서를 보았습니다. R 코드는 다음과 같습니다. #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

8
가설이 없을 때의 P 값의 풍부
나는 역학에 빠졌다. 나는 통계학자는 아니지만 종종 어려움을 겪지 만 직접 분석을 시도합니다. 나는 2 년 전에 나의 첫 분석을했다. 설명 테이블에서 회귀 분석에 이르기까지 P 값은 분석의 모든 곳에 포함되었습니다. 조금씩, 내 아파트에서 일하는 통계 학자들은 내가 실제로 가설을 가지고있는 곳을 제외하고 p 값을 모두 (!) 건너 뛰도록 설득했습니다. …

1
자유도는 정수가 아닌 숫자 일 수 있습니까?
GAM을 사용할 때 잔여 DF는 (코드의 마지막 줄). 그게 무슨 뜻이야? GAM 예제를 넘어 서면 일반적으로 자유도는 정수가 아닌 숫자 일 수 있습니까?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

3
p <.05에서 공개 된 p- 값 분포의 불연속성을 유발하는 원인은 무엇입니까?
최근 논문 에서 Masicampo and Lalande (ML)는 여러 연구에서 발표 된 많은 p- 값을 수집했습니다. 그들은 표준 임계치 5 %에서 p- 값의 히스토그램에서 호기심 많은 점프를 관찰했습니다. Wasserman 교수의 블로그에서이 ML 현상에 대한 좋은 토론이 있습니다. http://normaldeviate.wordpress.com/2012/08/16/p-values-gone-wild-and-multiscale-madness/ 그의 블로그에는 히스토그램이 있습니다. 5 % 수준은 자연의 법칙이 아니라 관례이기 때문에 출판 …

1
Mantel 테스트를 비대칭 매트릭스로 확장 할 수 있습니까?
벽난로 테스트는 일반적으로 대칭 거리 / 차 행렬에 적용됩니다. 내가 이해하는 한, 테스트의 가정은 차이를 정의하는 데 사용되는 측정 값이 최소한 반 메트릭이어야한다는 것입니다 (삼각형 불평등이 아닌 메트릭의 표준 요구 사항을 충족해야 함). 대칭의 가정이 완화 될 수 있습니까 (사전 측정치 제공)? 이 경우 전체 행렬을 사용하여 순열 테스트를 적용 …

4
Ziliak (2011)는 p- 값의 사용을 반대하고 몇 가지 대안을 언급합니다. 그들은 무엇인가?
통계적 추론에 대한 p- 값에 의존하는 단점에 대해 논의한 최근 기사에서 "매트릭스 v. 시라쿠사 노 및 학생 v. 피셔 통계적 유의성" (DOI : 10.1111 / j.1740-9713.2011.00511.x), Stephen T. Ziliak은 p- 값 사용에 반대합니다. 결론적 인 문단에서 그는 말한다 : 데이터는 우리가 이미 알고있는 것 중 하나입니다. 우리가 실제로 알고 싶은 …

3
Kolmogorov-Smirnov 테스트가 작동하는 이유는 무엇입니까?
2- 표본 KS 테스트에 대해 읽을 때 정확히 무엇을하는지 이해 하지만 왜 작동하는지 이해하지 못합니다 . 즉, 경험적 분포 함수를 계산하고, D- 통계량을 찾고, 임계 값을 계산하고, D- 통계량을 p- 값으로 변환하는 등 둘 사이의 최대 차이를 찾기 위해 모든 단계를 수행 할 수 있습니다. 그러나 왜 이것이 두 배포판에 …

4
테스트가 서로 관련되어있는 여러 테스트 (유전학)에 대한 p 값 수정
많은 테스트에서 p 값이 있으며 여러 테스트를 수정 한 후 실제로 중요한 것이 있는지 알고 싶습니다. 합병증 : 내 테스트는 독립적이지 않습니다. 내가 생각하고있는 방법 (Fisher 's Product Method의 변형, Zaykin et al., Genet Epidemiol , 2002)은 p 값 사이의 상관 관계가 필요합니다. 이 상관 관계를 추정하기 위해 현재 부트 …

4
R에서 정확한 두 표본 비율 이항 테스트 (및 일부 이상한 p- 값)
다음 질문을 해결하려고합니다. A 선수는 25 경기 중 17 승, B 선수는 20 명 중 8 승을 기록했습니다. 두 비율 사이에 큰 차이가 있습니까? R에서해야 할 일은 다음과 같습니다. &gt; prop.test(c(17,8),c(25,20),correct=FALSE) 2-sample test for equality of proportions without continuity correction data: c(17, 8) out of c(25, 20) X-squared = 3.528, …

3
A / B 테스트를위한 샘플 크기를 안전하게 결정
A / B 테스트 도구 를 구축하려는 소프트웨어 엔지니어 입니다. 나는 통계 통계가 확실하지 않지만 지난 며칠 동안 꽤 많이 읽었습니다. 여기에 설명 된 방법론을 따르고 있으며 아래 관련 요점을 요약합니다. 이 도구를 사용하면 설계자와 도메인 전문가가 웹 사이트를 구성하여 특정 URL에서 수신 된 트래픽을 둘 이상의 URL로 분할 할 …

4
변수 사이의 상호 작용을 고려할 때 선형 회귀 분석과 분산 분석이 다른 값을 제공하는 이유는 무엇 입니까?
회귀 모델을 사용하여 하나의 시계열 데이터 (복제 제외)를 맞추려고했습니다. 데이터는 다음과 같습니다. &gt; xx.2 value time treat 1 8.788269 1 0 2 7.964719 6 0 3 8.204051 12 0 4 9.041368 24 0 5 8.181555 48 0 6 8.041419 96 0 7 7.992336 144 0 8 7.948658 1 1 9 …

3
p- 값, 유의 수준 및 유형 I 오류 비교 및 ​​대조
p- 값, 유의 수준 및 유형 I 오류의 정의 및 사용에 대해 간결한 요약을 제공 할 수 있는지 궁금합니다. p- 값은 "실제로 관찰 한 것 이상으로 테스트 통계를 얻을 확률"로 정의되는 반면, 유의 수준은 p- 값이 유의한지 여부를 측정하기위한 임의의 컷오프 값일뿐입니다. . 유형 I 오류는 참 가설을 기각 한 …

5
분류 결과의 중요성을 테스트하는 올바른 방법은 무엇입니까
여러 분류기를 훈련 시키거나 여러 가지 특징 추출 방법을 사용할 수있는 상황이 많이 있습니다. 문헌에서 저자는 종종 데이터의 무작위 분할에 대한 평균 분류 오류 (즉, 이중 중첩 교차 검증 후)를 제공하고 때로는 분할에 대한 오류에 차이를 주기도합니다. 그러나 이것 자체로는 하나의 분류 기가 다른 분류기보다 훨씬 우수하다고 말할 수는 없습니다. …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.