«modeling» 태그된 질문

이 태그는 통계 또는 기계 학습 모델을 만드는 프로세스를 설명합니다. 항상 더 구체적인 태그를 추가하십시오.

9
평신도가 종종 분석을 수행하는 시대에 모델 가정과 평가의 중요성을 과장하고 있습니까?
결론적으로 , 통계에 대해 더 많이 배울수록 내 분야의 논문을 신뢰하는 것이 줄어 듭니다. 나는 연구원들이 통계를 충분히 잘하지 못한다고 생각합니다. 저는 평신도입니다. 저는 생물학 교육을 받았지만 통계 나 수학에 대한 공식 교육은 없습니다. 나는 R을 즐기고 종종 연구를 할 때 적용하는 방법의 이론적 기초를 읽고 이해하려고 노력합니다. 오늘날 분석을 …

5
회귀 이해-모델의 역할
매개 변수를 얻으려는 함수를 모르는 경우 회귀 모델을 어떻게 사용할 수 있습니까? 나는 한 자녀가 모유를 먹인 어머니가 후기에 당뇨병에 걸릴 가능성이 적다는 연구 결과를 보았다. 이 연구는 약 1000 명의 어머니를 대상으로 한 조사에서 이루어졌으며 기타 요인에 대한 통제가 이루어졌으며 로그 선형 모델이 사용되었습니다. 이것은 당뇨병의 가능성을 결정하는 훌륭한 …

8
모든 모델이 쓸모 없습니까? 정확한 모델이 가능합니까?
이 질문은 한 달 이상 내 마음 속에 퍼져 왔습니다. Amstat News 2015 년 2 월호 에는 버클리 교수 Mark van der Laan 의 기사 가 실려 있으며 부정확 한 모델을 사용하는 사람들을 꾸짖습니다. 그는 모형을 사용함으로써 통계는 과학 이라기보다는 예술이라고 말합니다. 그에 따르면, 항상 "정확한 모델"을 사용할 수 있으며, …

4
통계 모델 치트 시트
통계 정보 "치트 시트"가 하나 이상 있는지 궁금합니다. 모델 사용시기 모델을 사용하지 않을 때 필수 및 선택적 입력 예상 출력 모델이 다른 분야 (정책, 바이오, 엔지니어링, 제조 등)에서 테스트 되었습니까? 실무 또는 연구에서 허용됩니까? 예상되는 변화 / 정확도 / 정밀도 경고 확장 성 더 이상 사용되지 않는 모델, 피하거나 사용하지 …

2
음 이항 분포 내부의 모수 이해
나는 다양한 모델로 내 데이터에 적합하고 있음을 파악하려고했다 fitdistr라이브러리 함수 MASS의이 R저를주는 Negative Binomial가장 적합한다. 이제 위키 페이지에서 정의는 다음과 같습니다. NegBin (r, p) 분포는 마지막 시험에서 성공한 k + r Bernoulli (p) 시험에서 k 실패 및 r 성공 확률을 설명합니다. R모델 피팅을 수행하는 데 사용하면 두 개의 매개 변수 …

7
다중 선형 회귀 모형에 포함 할 변수 선택
현재 다중 선형 회귀를 사용하여 모델을 작성하려고합니다. 내 모델을 둘러 본 후에는 유지할 변수와 제거 할 변수를 가장 잘 결정하는 방법을 모르겠습니다. 내 모델은 DV에 대한 10 개의 예측 변수로 시작했습니다. 10 개의 예측 변수를 모두 사용할 때 4 개가 유의 한 것으로 간주되었습니다. 명백히 틀린 예측 변수 중 일부만 …

5
상호 작용 효과를 식별하는 모범 사례는 무엇입니까?
모델 ( x1:x2또는 x1*x2 ... xn-1 * xn) 에서 변수의 가능한 각 조합을 문자 그대로 테스트하는 것 외에 . 독립적 (희망) 변수 사이에 교호 작용이 있어야하는지 또는 어떻게해야하는지 어떻게 식별합니까? 상호 작용을 식별하려는 모범 사례는 무엇입니까? 사용할 수 있거나 사용할 수있는 그래픽 기술이 있습니까?

3
R과 함께 ARIMAX 모델을 맞추는 방법?
시간별 측정에는 4 가지 시계열이 있습니다. 집안의 열 소비 집 밖 온도 태양 복사 풍속 집안의 열 소비량을 예측할 수 있기를 원합니다. 매년 계절과 계절에 따라 뚜렷한 계절 경향이 있습니다. 다른 계열간에 명확한 상관 관계가 있기 때문에 ARIMAX 모델을 사용하여 적합하게 만들고 싶습니다. 패키지 TSA의 arimax 함수를 사용하여 R에서 수행 …

1
음 이항 회귀 문제-모형이 좋지 않습니까?
카운트 데이터의 회귀 모델에 대한 Sellers and Shmueli 의 매우 흥미로운 기사를 읽고 있습니다. 처음에 그들은 (p. 944) McCullaugh와 Nelder (1989)를 인용하여 부정적인 이항 회귀는 인기가없고 문제적인 정식 연관성이 있다고 말했다. 나는 언급 된 구절을 발견했고 그것을 말한다 (M과 N의 374 쪽) "응용 프로그램에서 마이너스 이항 분포를 거의 사용하지 않은 …

3
변수 선택이 필요한 이유는 무엇입니까?
일반적인 데이터 기반 변수 선택 절차 (예 : 정방향, 역방향, 단계적, 모든 하위 집합)는 다음을 포함하여 바람직하지 않은 속성을 가진 모델을 생성하는 경향이 있습니다. 계수는 0에서 멀어졌습니다. 너무 작은 표준 오차와 너무 좁은 신뢰 구간 알려진 의미가없는 통계 및 p- 값을 테스트합니다. 지나치게 낙관적 인 모형 적합 추정치. 의미가없는 포함 …

2
SVM 알고리즘의 기본 통계 모델은 무엇입니까?
모델 기반 접근 방식을 사용하여 데이터를 처리 할 때 첫 번째 단계는 데이터 모델을 통계 모델로 모델링하는 것입니다. 다음 단계는이 통계 모델을 기반으로 효율적 / 빠른 추론 / 학습 알고리즘을 개발하는 것입니다. 그래서 어떤 통계 모델이 SVM (Support Vector Machine) 알고리즘 뒤에 있는지 묻고 싶습니까?

5
베이지안 네트워크와 Markov 프로세스의 차이점은 무엇입니까?
베이지안 네트워크와 마르코프 프로세스의 차이점은 무엇입니까? 나는 둘 다의 원리를 이해했다고 믿었지만 지금은 두 가지를 비교해야 할 때 잃어버린 느낌이 든다. 그들은 나에게 거의 같은 의미입니다. 분명히 그들은 아닙니다. 다른 자료에 대한 링크도 높이 평가됩니다.

1
lmer 모델의 효과 반복 계산
방금 혼합 효과 모델링을 통해 측정의 반복성 (일명 신뢰성, 일명 클래스 내 상관 관계)을 계산하는 방법을 설명하는 이 문서를 보았습니다. R 코드는 다음과 같습니다. #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 


6
ROC AUC와 F1 점수 중에서 선택하는 방법은 무엇입니까?
나는 최근 경쟁 요구 사항에 따라 roc auc 점수가 사용되는 Kaggle 경쟁을 완료했습니다. 이 프로젝트 이전에는 일반적으로 f1 점수를 메트릭으로 사용하여 모델 성능을 측정했습니다. 앞으로이 두 지표 중에서 어떻게 선택해야하는지 궁금합니다. 언제 어떤 것을 사용해야하며 각각의 장단점이 무엇입니까? Btw, 나는 기사를 읽었습니다. AUC와 F1 점수의 차이점은 무엇입니까? 그러나 언제 어느 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.