«outliers» 태그된 질문

특이 치는 데이터 세트의 간단한 특성화와 관련하여 비정상적이거나 잘 설명되지 않은 것으로 보입니다. 불쾌한 가능성은 이러한 데이터가 연구 대상이 아닌 다른 인구에서 온 것일 수 있습니다.

4
중요하지 않기 때문에 연구에서 데이터를 제거 할 수 있습니까?
sciencemag.org에 관한 기사 를 읽는 동안이 문장을 만났습니다 . 결국, 남은 데이터가 통계적으로 유의미한 것으로 간주되지 않았기 때문에 12 개국 7600 명의 연구원들의 응답이 포함되었습니다. 이것이 적절한 연구 방법입니까? 통계적으로 유의하지 않은 것으로 간주되어 결과를 남기지 않겠습니까?

4
변수 순서가 선형 회귀에서 중요합니까?
두 변수 ( 과 ) 사이의 상호 작용을 조사 하고 있습니다. 와 이러한 변수 사이에는 많은 선형 상관 관계가 있습니다. 문제의 본질에서 인과 관계에 대해 아무 말도 할 수 없습니다 ( 이 유발 하는지 또는 다른 방법으로). 특이 치를 탐지하기 위해 회귀선과의 편차를 연구하고 싶습니다. 이를 위해 의 함수로 의 …

5
이상 감지를위한 자동 임계 값 결정
나는 시계열의 변칙 점수로 작업하고 있습니다 (배경은 컴퓨터 네트워크에서 변칙 탐지입니다). 1 분마다 , 네트워크의 현재 상태가 "예기치 않은"또는 비정상 인 방법을 알려주 는 이상 점수 를 얻습니다 . 점수가 높을수록 현재 상태가 비정상입니다. 5에 가까운 점수는 이론적으로 가능하지만 거의 발생하지 않습니다.엑스티∈[0,5]xt∈[0,5]x_t \in [0, 5] 이제이 변칙적 시계열 의 임계 …

2
데이터에 대한 ROC 곡선 계산
그래서, 나는 16 개의 시험을 가지고 있는데, 여기에서 Hamming Distance를 사용하여 생체 특성으로부터 사람을 인증하려고합니다. 임계 값이 3.5로 설정되었습니다. 내 데이터는 다음과 같으며 1 번 시험 만 참 긍정입니다. Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.