«model» 태그된 질문

수학적 방정식의 형태로 확률 적으로 (임의로) 관련된 변수 사이의 관계 공식화. ITSELF에서이 태그를 사용하지 마십시오. 항상 더 구체적인 태그를 포함하십시오.

7
얼마를 지불합니까? 실용적인 문제
이것은 가정 문제가 아니라 회사가 직면 한 실제 문제입니다. 매우 최근 (2 일 전) 우리는 딜러에게 10000 개의 제품 라벨 제조를 주문했습니다. 딜러는 독립적 인 사람입니다. 그는 외부에서 제조 된 라벨을 받고 회사는 딜러에게 지불합니다. 각 라벨의 가격은 회사에 정확히 1 달러입니다. 어제 딜러에게는 라벨이 붙어 있지만 라벨은 각각 100 …

4
모형을 만들 때 통계적으로 유의하지 않은 공변량을 '유지'해야합니까?
모형 계산에 여러 공변량이 있으며 모두 통계적으로 유의하지는 않습니다. 그렇지 않은 것을 제거해야합니까? 이 질문은 현상에 대해 설명하지만 ANCOVA에서 공변량의 유의하지 않은 영향을 해석하는 방법은 무엇입니까? 그 질문에 대한 답에는 중요하지 않은 공변량이 제거 될 것을 암시하는 것은 없지만, 지금 당장은 그들이 머물러 있어야한다고 생각하는 경향이 있습니다. 일부 임계 값 …

2
중첩이있는 혼합 효과 모델
다음과 같이 구성된 실험에서 수집 한 데이터가 있습니다. 각각 30 그루의 나무가있는 두 곳. 15 개가 치료되고 15 개가 각 현장에서 통제됩니다. 각 나무에서 우리는 줄기 세 조각과 뿌리 세 조각을 샘플링하므로 나무 당 6 레벨 1 샘플이 두 요소 수준 (뿌리, 줄기) 중 하나로 표시됩니다. 그런 다음 줄기 / …

6
파시 모니가 여전히 황금 표준이어야합니까?
그냥 생각 : Parsimonious 모델은 항상 모델 선택에서 기본으로 사용되었지만이 방법은 어느 정도 구식입니까? parsimony에 대한 우리의 경향이 abaci와 슬라이드 규칙의 시간 (또는 더 심각하지 않은 현대 컴퓨터)의 유물인지 궁금합니다. 오늘날의 컴퓨팅 성능을 통해 예측 능력이 더욱 강화 된 복잡한 모델을 구축 할 수 있습니다. 이러한 컴퓨팅 성능의 상한이 높아짐에 …

2
왜 일반 오류 대신 t 오류를 사용해야합니까?
에서 이 앤드류 겔만으로 블로그 게시물, 다음과 같은 구절이있다 : 50 년 전의 베이지안 모델은 절망적으로 단순 해 보이지만 (물론 간단한 문제는 제외하고) 오늘날의 베이지안 모델은 50 년 동안 절망적으로 단순 해 보일 것으로 기대합니다. (간단한 예를 들자면, 우리는 아마도 어디에서나 일반적인 오류 대신에 t를 일상적으로 사용해야 할 것입니다. 그러나 …

6
평신도의 관점에서 모델과 분포의 차이점은 무엇입니까?
Wikipedia에 정의 된 답변 (정의)은 아마도 수학 / 통계에 익숙하지 않은 사람들에게는 약간의 암호입니다. 수학적 용어로, 통계 모델은 일반적으로 쌍 ( ) 으로 생각되며 , 여기서 S 는 가능한 관측치 세트, 즉 샘플 공간이고 P 는 S 의 확률 분포 세트입니다 .S,PS,PS, \mathcal{P}SSSPP\mathcal{P}SSS 확률 및 통계에서 확률 분포는 확률 실험에서 …

5
과적 합 모델이 반드시 쓸모 없는가?
모델이 훈련 데이터의 정확도는 100 %이지만 테스트 데이터의 정확도는 70 %라고 가정합니다. 이 모델에 대해 다음과 같은 주장이 사실입니까? 이것이 과적 합 된 모델이라는 것은 명백합니다. 과적 합을 줄임으로써 테스트 정확도를 향상시킬 수 있습니다. 그러나이 모델은 테스트 데이터에 적합한 정확도를 갖기 때문에 여전히 유용한 모델이 될 수 있습니다.

3
"통계 실험"과 "통계 모델"의 차이점은 무엇입니까?
나는 AW van der Vaart, asymptotic statistics (1998)를 따르고 있습니다. 그는 통계 실험과 통계 모델과는 다르다고 주장하지만, 둘 다 정의하지는 않습니다. 내 질문: (1) 통계 실험, (2) 통계 모델 및 (3) 통계 실험을 통계 모델과 구분할 수있는 핵심 요소는 무엇입니까?

3
회귀 분석에서 귀무 모델은 무엇이며 귀무 가설과 어떤 관련이 있습니까?
회귀 분석에서 귀무 모델은 무엇이며 귀무 모델과 귀무 가설 사이의 관계는 무엇입니까? 내 이해를 위해, 그것은 의미 하는가 연속 반응 변수를 예측하기 위해 "응답 변수의 평균"을 사용 하는가? 이산 반응 변수를 예측할 때 "라벨 분포"를 사용하십니까? 이 경우 귀무 가설간에 연결이 누락 된 것 같습니다.

2
다루기 어려운 가능성을 가진 정말 간단한 모델의 예는 무엇입니까?
대략적인 베이지안 계산 은 기본적으로 확률 모델이 적합하지 않은 모델에 적합하도록하는 멋진 기법입니다 (예 : 모수를 수정하면 모델에서 샘플링 할 수 있지만 수치, 알고리즘 또는 분석적 으로 가능성을 계산할 수는 없음 ). 청중에 대략적인 베이지안 계산 (ABC)을 도입하면 정말 간단하지만 여전히 다소 흥미로운 몇 가지 예제 모델을 사용하는 것이 좋다 …

4
반복 횟수가 증가함에 따라 그라디언트 부스팅 기계 정확도가 감소합니다.
caretR 의 패키지를 통해 그라디언트 부스팅 머신 알고리즘을 실험하고 있습니다 . 소규모 대학 입학 데이터 세트를 사용하여 다음 코드를 실행했습니다. library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

3
Schoenfeld 잔차가 좋지 않을 때 비례 위험 회귀 모형의 옵션은 무엇입니까?
coxph많은 변수를 포함 하는를 사용하여 R에서 Cox 비례 위험 회귀를 수행하고 있습니다. Martingale 잔차는 훌륭해 보이며, Schoenfeld 잔차는 모든 변수에 가장 좋습니다. Schoenfeld 잔차가 평탄하지 않은 변수는 세 가지가 있으며 변수의 특성은 시간에 따라 변할 수 있다는 의미입니다. 이것들은 내가 정말로 관심이없는 변수이므로 계층화하는 것이 좋습니다. 그러나 이들 모두는 범주 …

2
두 개의 선형 회귀 모델이 주어지면 어떤 모델이 더 잘 수행됩니까?
대학에서 기계 학습 과정을 수강했습니다. 퀴즈 중 하나 에서이 질문을 받았습니다. 모델 1 : y=θx+ϵy=θx+ϵ y = \theta x + \epsilon 모델 2 : y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x + \theta^2 x + \epsilon 위의 모델 중 어느 것이 데이터에 더 적합합니까? (선형 회귀를 사용하여 데이터를 모델링 할 수 있다고 …

2
부정확 화에 따른 통계적 추론
통계적 추론의 고전적인 처리는 올바르게 지정된 통계가 사용된다는 가정에 의존합니다. 즉, 유통 인 P∗(Y)P∗(Y)\mathbb{P}^*(Y) 가 감시 데이터를 생성하는 것이 yyy 통계 모델의 부분 MM\mathcal{M} : P∗(Y)∈M={Pθ(Y):θ∈Θ}P∗(Y)∈M={Pθ(Y):θ∈Θ}\mathbb{P}^*(Y) \in \mathcal{M}=\{\mathbb{P}_\theta(Y) :\theta \in \Theta\} 하지만, 대부분의 상황에서는 불가능 이것이 사실이라고 가정하십시오. 올바르게 지정된 가정을 철회하면 통계적 추론 절차가 어떻게 진행되는지 궁금합니다. White 1982의 …

1
범주 형 변수 사이의 교호 작용이 포함 된 경우 혼합 모형의 회귀 출력 해석
혼합 모델 / lmer 사용에 대한 질문이 있습니다. 기본 모델은 다음과 같습니다. lmer(DV ~ group * condition + (1|pptid), data= df) 그룹과 조건은 모두 요인입니다. 그룹에는 두 가지 수준 (groupA, groupB)이 있고 조건에는 세 가지 수준 (condition1, condition2, condition3)이 있습니다. 그것은 인간 대상의 데이터이므로 pptid는 각 사람에게 무작위 효과입니다. 모델은 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.