«hypothesis-testing» 태그된 질문

가설 검정은 데이터가 임의 변동의 영향보다는 주어진 가설과 일치하지 않는지 여부를 평가합니다.

16
정규성 테스트가 '필수적으로 쓸모없는'가요?
전직 동료가 한 번 나에게 다음과 같이 주장했다. 우리는 일반적으로 널 (null) 하에서 무조건 또는 거의 정상적인 랜덤 변수를 생성하는 공정 결과에 정규성 테스트를 적용 합니다 ( '무증상'부분은 우리가 만들 수없는 수량에 의존합니다). 저렴한 메모리, 빅 데이터 및 빠른 프로세서의 시대에 정규성 테스트는 항상 큰 (심지어 크지는 않지만) 샘플에 대한 …

16
통계 테스트에서 p 값과 t 값의 의미는 무엇입니까?
통계 과정을 밟고 동료 학생들을 돕기 위해 노력한 후, 많은 헤드 데스크 뱅킹에 영감을주는 한 가지 주제가 통계적 가설 검정의 결과를 해석하고 있음을 발견했습니다. 학생들은 주어진 시험에 필요한 계산을 수행하는 방법을 쉽게 배우지 만 결과 해석에 매달리는 것 같습니다. 많은 전산화 도구는 "p 값"또는 "t 값"으로 테스트 결과를보고합니다. 통계에서 첫 …

8
페이스 북이 끝나고 있습니까?
최근 에이 논문 은 많은 주목을 받았다 (예 : WSJ ). 기본적으로 저자는 2017 년까지 페이스 북이 회원의 80 %를 잃을 것이라고 결론을 내렸다. 그들은 역학에서 자주 사용되는 구획 모델 인 SIR 모델 의 외삽을 근거로 주장을하고있다 . Google의 검색에서 "Facebook"에 대한 데이터를 가져 오며 저자는 Myspace의 소멸을 사용하여 결론을 …

14
대규모 데이터 세트가 가설 ​​검정에 적합하지 않습니까?
A의 최근 기사 의 Amstat 뉴스 을 선언합니다 - 저자 (마크 반 데르 Laan와 세리 로즈) 우리는 충분히 큰 표본 크기에 대한, 아니 효과의 귀무 가설이 참하는 모든 연구를 포함하여 사람이 알고 "고 말했다 통계적으로 유의 한 효과. " 글쎄, 나는 그것을 알지 못했다. 이것이 사실입니까? 가설 검정이 대규모 데이터 …

8
ASA는 한계에 대해 논의 합니다. 대안은 무엇입니까?
우리는 이미 여러 스레드에 p- 값 으로 태그가 지정되어 있으며 이들에 대해 많은 오해가 있습니다. 10 개월 전에 우리에 대한 스레드를했다 "금지"라는 심리학 저널 -values을p피p p 지금, 미국의 통계 협회 (2016) 분석과 우리 "는의 계산으로 끝나지해야한다고 말한다 - 값".p피p ASA (American Statistical Association)는 과학계가 값 의 올바른 사용과 해석에 기반을 …

9
이것이 실제로 p- 값이 작동하는 방법입니까? 연간 백만 개의 논문이 순수한 무작위성에 기초 할 수 있습니까?
통계를 처음 접했고 포함한 기본 사항을 이해하는 법을 배우고 있습니다. 그러나 지금 내 마음에는 큰 물음표가 있으며, 나는 내 이해가 잘못되기를 바랍니다. 내 생각 과정은 다음과 같습니다.피pp 전 세계의 모든 연구가 "무한 원숭이 정리"의 원숭이와 다소 같지 않습니까? 세계에는 23887 개의 대학이 있다고 생각하십시오. 각 대학교에 1000 명의 학생이 있다면 …

7
작은 샘플에서 Wilcoxon과 같은 t- 테스트 또는 비모수 테스트 중에서 선택하는 방법
특정 가설은 스튜던트 t- 검정 (2 샘플 경우 불균형 변동에 대한 Welch의 보정을 사용하여)을 사용하거나 Wilcoxon 대응 부호 순위 검정 인 Wilcoxon-Mann-Whitney U 검정과 같은 비모수 검정을 사용하여 검정 할 수 있습니다. 또는 쌍 부호 테스트. 우리는 어떻게 할 수 원칙 시험은 표본의 크기는 "작은"특히 경우, 가장 적합한 인에 대한 …

2
우리는 p-hacking에 대해 얼마나 알고 있습니까?
p- 해킹 ( "데이터 준설" , "스누핑"또는 "낚시")이라는 문구 는 결과적으로 인위적으로 통계적으로 유의미한 다양한 종류의 통계적 과실을 말합니다. "더 중요한"결과를 얻는 방법에는 여러 가지가 있습니다. 패턴이 발견 된 데이터의 "흥미로운"부분 집합 만을 분석하는 것 ; 다중 테스트 , 특히 사후 테스트에 적합하게 조정하지 못하고 수행되지 않은 테스트를보고하지 않은 경우; …

3
"순진한 부트 스트랩"이 실패하는 예는 무엇입니까?
알 수 없거나 복잡한 분포의 표본 데이터 집합이 있고 데이터의 통계적 에 대해 약간의 추론을 수행하려고한다고 가정 합니다. 내 기본 성향은 교체와 부트 스트랩 샘플의 무리를 생성하고, 내 통계 계산하는 것입니다 위한 추정 분포를 생성하기 위해 각각의 부트 스트랩 샘플 .TTTTTTTTT 이것이 나쁜 생각의 예는 무엇입니까? 예를 들어,이 부트 스트랩을 …


3
예 : 이진 결과에 glmnet을 사용하는 LASSO 회귀
관심있는 결과가 이분법 인 LASSO Regressionglmnet 과 함께 사용하기 시작했습니다 . 아래에 작은 모의 데이터 프레임을 만들었습니다. age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

4
심리학 저널은 p- 값과 신뢰 구간을 금지했습니다. 실제로 사용을 중단하는 것이 현명한가?
2015 년 2 월 25 일, Basic and Applied Social Psychology 저널 은 미래의 모든 논문에서 p- 값 과 신뢰 구간을 금지 하는 사설 을 발표했습니다.피pp 특히, 그들은 (포맷과 강조는 내 것입니다) : [...] 출판 전에, 저자는 NHSTP의 모든 흔적을 제거해야한다 [널 가설 유의성 테스트 절차] ( , t- 값 …

4
Fisher 및 Neyman-Pearson 프레임 워크를 언제 사용해야합니까?
피셔의 가설 검정 방법과 Neyman-Pearson 사고 학교의 차이점에 대해 최근에 많이 읽었습니다. 나의 질문은 잠시 철학적 이의를 무시하는 것이다. 통계 모델링에 대한 Fisher의 접근 방식은 언제 사용해야하고, 중요도 수준 등의 Neyman-Pearson 방법은 언제 사용해야합니까? 어떤 실질적인 문제에서 어떤 견해를지지 할 것인지 결정하는 실용적인 방법이 있습니까?

8
기존 변수와 정의 된 상관 관계를 갖는 랜덤 변수 생성
시뮬레이션 연구를 위해 기존 변수 와의 미리 정의 된 (인구) 상관 관계를 나타내는 임의의 변수를 생성해야합니다 .YYY I는 들여다 R패키지 copula와 CDVine소정 의존성 구조 랜덤 변수 분포를 생성 할 수있다. 그러나 결과 변수 중 하나를 기존 변수에 고정 할 수 없습니다. 기존 기능에 대한 아이디어와 링크를 부탁드립니다! 결론 : 서로 …

9
중요한 F 통계량 (p <.001)이지만 중요하지 않은 회귀 분석 t- 검정을 얻는 이유는 무엇입니까?
다중 선형 회귀 분석에서 왜 유의 한 F 통계량 (p &lt;.001)을 가질 수 있지만 모든 회귀 분석에서 t- 값이 매우 높은가? 내 모델에는 10 개의 회귀자가 있습니다. 하나는 p- 값이 0.1이고 나머지는 0.9 이상입니다. 이 문제를 해결 하려면 다음 질문을 참조하십시오 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.