«experiment-design» 태그된 질문

변형이 존재하는 정보 수집 운동을 구성하는 방법에 대한 연구.

16
실험 디자인에 대한 추천 도서?
실험 설계에 관한 책에 대한 패널의 권장 사항은 무엇입니까? 이상적으로는 책이 여전히 인쇄 가능하거나 전자 방식으로 제공되어야하지만 항상 가능하지는 않습니다. 책에 대해 좋은 점에 대해 몇 마디도 더해 주겠다고 생각한다면 너무 좋을 것입니다. 또한 투표가 제안을 정렬하는 데 도움이되도록 답변 당 하나의 책을 목표로합니다. (커뮤니티 위키, 더 좋게 만들려면 질문을 …

4
이항 데이터에 대한 분산 분석
실험 데이터 세트를 분석하고 있습니다. 데이터는 치료 유형의 쌍 벡터와 이항 결과로 구성됩니다. Treatment Outcome A 1 B 0 C 0 D 1 A 0 ... 결과 열에서 1은 성공을 나타내고 0은 실패를 나타냅니다. 치료법이 결과에 크게 다른지를 알아 내고 싶습니다. 각 실험에 대해 4 번의 처리가 여러 번 반복되었습니다 …

3
무작위 표본이 명확하지 않은 경우 어떻게해야합니까?
당신은 무작위로 샘플을 채취하고 그것이 같이 명확하게 반영하지 않고 볼 수있는 경우에는 어떻게 최근 질문 . 예를 들어 모집단 분포가 0을 기준으로 대칭 인 것으로 가정하고 무작위로 추출한 표본에 불균형 긍정적 및 부정적 관측치가 있고 불균형이 통계적으로 유의하면 어디에서 벗어날 수 있습니까? 치우친 표본을 기반으로 모집단에 대해 어떤 합리적인 진술을 …

4
실험 설계의 함정 : 죽은 실험 피하기
나는이 인용문을 여러 번 보았습니다. 실험이 완료된 후 통계 학자와상의하는 것은 종종 사후 검증을 요청하는 것입니다. 그는 아마도 실험이 죽었다고 말할 수 있습니다. - 로널드 피셔 (1938) 나에게는 아마 조금 어쩌면 보인다. 내가 디자인을 잘하지 않고 실험을하는 방법을 설명 할 수있는 유일한 예는 통제력이 부족하거나 통제력이 부족한 것입니다. 예를 들어, …



4
(일부) 의사 난 수화의 문제점
나는 50 세가 넘는 환자들이 출생 연도에 의해 의사 난 수화되는 연구를 보았습니다. 출생 연도가 짝수 인 경우, 평소의 치료, 홀수 인 경우, 중재. 구현하기가 쉽고, 전복하기가 더 어렵고 (환자가 어떤 치료를 받아야하는지 쉽게 확인할 수 있음) 기억하기 쉽습니다 (지정은 몇 년 동안 진행되었습니다). 그러나 여전히 마음에 들지 않습니다. 적절한 …

4
PCA 공간에 새로운 벡터를 투영하는 방법?
주성분 분석 (PCA)을 수행 한 후 PCA 공간에 새 벡터를 투영하려고합니다 (즉, PCA 좌표계에서 해당 좌표를 찾습니다). 를 사용하여 R 언어로 PCA를 계산했습니다 prcomp. 이제 내 벡터에 PCA 회전 행렬을 곱할 수 있어야합니다. 이 매트릭스의 주요 구성 요소를 행 또는 열로 배열해야합니까?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

5
실험 설계의 블록은 무엇입니까?
실험 설계에서 블록의 개념에 대해 두 가지 질문이 있습니다. (1) 블록과 요인의 차이점은 무엇입니까? (2) 일부 책을 읽으려고했지만 분명하지 않은 내용이 있습니다. 저자는 항상 "블록 팩터"와 다른 팩터 사이에 상호 작용이 없다고 가정합니다.

2
요인 / 변수를 어떻게“통제”합니까?
내가 이해하기에 "통제"는 통계에서 두 가지 의미를 가질 수 있습니다. 대조군 : 실험에서 대조군의 구성원에게는 치료가 제공되지 않았다. 예 : 위약 대 약물 : 한 그룹에 약물을 투여하고 다른 그룹에는 약물을 투여하지 않습니다 (대조군). "제어 된 실험"이라고도합니다. 변수 제어 : 특정 독립 변수의 효과를 분리하는 기술. 이 기법들에 주어진 다른 …

3
"통계 실험"과 "통계 모델"의 차이점은 무엇입니까?
나는 AW van der Vaart, asymptotic statistics (1998)를 따르고 있습니다. 그는 통계 실험과 통계 모델과는 다르다고 주장하지만, 둘 다 정의하지는 않습니다. 내 질문: (1) 통계 실험, (2) 통계 모델 및 (3) 통계 실험을 통계 모델과 구분할 수있는 핵심 요소는 무엇입니까?

3
공식이나 분석에서 데이터를 시뮬레이션하는 일반적인 방법이 있습니까?
실험 설계 데이터 프레임에서 데 노보 데이터의 시뮬레이션. R에 중점을 둔다면 (다른 언어 솔루션도 훌륭 할 것입니다). 실험 또는 측량을 설계 할 때 데이터를 시뮬레이션하고이 시뮬레이션 된 데이터에 대한 분석을 수행하면 설계의 장단점에 대한 훌륭한 통찰력을 얻을 수 있습니다. 이러한 접근법은 통계 테스트의 이해와 올바른 사용에 필수적 일 수 있습니다. …

4
반복 횟수가 증가함에 따라 그라디언트 부스팅 기계 정확도가 감소합니다.
caretR 의 패키지를 통해 그라디언트 부스팅 머신 알고리즘을 실험하고 있습니다 . 소규모 대학 입학 데이터 세트를 사용하여 다음 코드를 실행했습니다. library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

4
이상적인 실험을 할 수 없을 때해야 할 일에 대한 교과서 / 독서?
나의 통계 훈련은 수학적 통계에 뿌리를두고 있으며,이 방법을 MS에 가져가는 것은 현재 약간 충격입니다. 업계에서 경험이 부족하기 때문에 현재 이러한 "적용된"방법 중 일부를 이해하기가 어렵습니다. 우리가 내 메소드 클래스에서 이야기 한 주제 중 하나는 실험 설계라는 아이디어입니다. 예를 들어, K-12 학생들의 시험 점수를 올리는 교육 프로그램의 효과에 대한 실험을하고 싶습니다. …

3
이 인용에서 Fisher는 무엇을 의미합니까?
나는이 유명한 인용문을 어디서나 계속 보지만, 강조된 부분을 매번 이해하지 못한다. 의미가 1 % 이상일 때 습관적 관행의 문제로 가설을 임시로 거부하는 사람은 그러한 결정의 1 % 이하로 오인 될 것입니다. 가설이 올 바르면 이러한 경우의 1 %만으로 오인 될 수 있으며, 틀린 경우 거부하지 않을 것입니다. [...] 그러나 계산은 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.