«definition» 태그된 질문

이 태그는 통계 용어 정의에 대한 질문을 나타냅니다. 정의와 관련이없는 통계 용어에 대한 질문에 대해서는보다 일반적인 태그 [용어]를 사용하십시오.

3
분포는 정확히 무엇입니까?
나는 확률과 통계에 대해 거의 알지 못하고 배우고 싶습니다. 나는 "배포"라는 단어가 다른 상황에서 사방에 사용 된 것을 본다. 예를 들어, 이산 랜덤 변수에는 "확률 분포"가 있습니다. 나는 이것이 무엇인지 안다. 연속 확률 변수는 들어, 확률 밀도 함수를 갖는 적분에서 에 확률 밀도 함수에서 평가 누적 분포 함수이고 .x∈Rx∈Rx\in\mathbb{R}−∞−∞-\inftyxxxxxx 그리고 …

4
반복 횟수가 증가함에 따라 그라디언트 부스팅 기계 정확도가 감소합니다.
caretR 의 패키지를 통해 그라디언트 부스팅 머신 알고리즘을 실험하고 있습니다 . 소규모 대학 입학 데이터 세트를 사용하여 다음 코드를 실행했습니다. library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

5
'공동 분포'와 '다변량 분포'라는 용어의 차이점은 무엇입니까?
나는 '다변량 분포'를 이해할 가능성이 높은 청중에게 '공동 확률 분포'를 사용하는 것에 대해 쓰고 있으므로 나중에 사용할 것을 고려하고 있습니다. 그러나 나는 이것을하는 동안 의미를 잃고 싶지 않습니다. Wikipedia 는 이것이 동의어임을 나타냅니다. 그들은? 그렇지 않다면 왜 안됩니까?

1
"Heywood Case"의 정확한 정의는 무엇입니까?
나는 "Heywood Case"라는 용어를 다소 비공식적으로 사용하여 온라인의 '유한 응답'반복적으로 업데이트 된 분산 추정치가 수치 정밀도 문제로 인해 부정적으로 된 상황을 언급했습니다. (데이터를 추가하고 오래된 데이터를 제거하기 위해 Welford 방법의 변형을 사용하고 있습니다.) 수치 오류나 모델링 오류로 인해 분산 추정치가 마이너스가 된 상황에 적용되었다는 인상을 받았지만 동료는 이 용어를 사용하면서 …

2
표본 분포와 무관 한 통계의 예?
이것은 wikipedia의 통계 에 대한 정의입니다. 보다 공식적으로 통계 이론은 통계 자체가 함수가 표본의 분포와 무관 한 표본의 함수로 정의합니다. 즉, 데이터를 실현하기 전에 기능을 설명 할 수 있습니다. 통계라는 용어는 함수와 주어진 샘플의 함수 값에 모두 사용됩니다. 나는이 정의의 대부분을 이해한다고 생각하지만, 그 부분 은 함수가 샘플의 분포와 무관 …

1
“인자 분석의 기본 정리”는 PCA에 어떻게 적용됩니까? 또는 PCA 로딩은 어떻게 정의됩니까?
저는 현재 "인자 분석"(PCA)에 대한 슬라이드 세트를 사용하고 있습니다. 여기에서 분석에 들어가는 데이터의 상관 행렬 ( )을 인자 로딩 행렬 ( A )을 사용하여 복구 할 수 있다고 주장하는 "인자 분석의 기본 정리"가 도출됩니다 .RR\bf RAA\bf A R=AA⊤R=AA⊤\bf R = AA^\top 그러나 이것은 나를 혼란스럽게합니다. PCA에서 "인자 로딩"의 행렬은 데이터의 …

1
공감 자-정의
그의 책 M. 카츠에 따르면, 다 변수 분석 (섹션 1.2, 6 페이지), " 교란 요인이 위험 인자와 연관되어 인과 결과. 관련 "왜 교란 요인이해야 인과 결과와 관련? 혼란자가 결과와 관련 되는 것으로 충분 합니까?


6
상태 'B'에서 요법 'A'의 이점을 결정할 때 효과와 효능의 차이는 무엇입니까?
이 질문의 맥락은 건강 체계 내에서, 즉 상태의 치료에서 하나 이상의 요법을 보는 것입니다. 잘 존경받는 연구원조차도 효능 과 효과 라는 용어를 혼동하는 것으로 보입니다. 용어를 상호 교환 적으로 사용하여 . 혼란을 제거하는 데 도움이되는 방법으로 효능 대 효과를 어떻게 생각할 수 있습니까? 두 가지 유형의 결과를 결정하는 데 가장 …

2
연산자 의미는 무엇입니까?
인과 관계에 대한 일부 문헌 리뷰에서 연산자를 어디에서나 보았습니다 예 : wikipedia 항목 참조 ). 그러나이 연산자에 대한 공식적이고 일반적인 정의를 찾을 수 없습니다.디o ( x )do(x)do(x) 누군가 내가 이것에 대한 좋은 참조를 지적 할 수 있습니까? 특정 실험에서의 해석보다는 일반적인 정의에 관심이 있습니다.

2
평신도의 용어로 톰슨 샘플링은 무엇입니까?
Thompson Sampling 과 작동 방식 을 이해할 수 없습니다 . 나는 Multi Arm Bandit에 대해 읽었고 Upper Confidence Bound Algorithm을 읽은 후 Thompson Sampling이 UCB보다 성능이 우수하다고 많은 텍스트를 제안했습니다. 평신도 또는 간단한 용어로 Thompson Sampling이란 무엇입니까? 추가 이해를 위해 참조 기사를 자유롭게 제공하십시오.


3
회귀 모형의 정의 및 구분
당황스럽게도 간단한 질문이지만 Cross Validated에서 이전에 요청되지 않은 것 같습니다. 회귀 모델의 정의는 무엇입니까? 또한 지원 질문 무엇 되지 회귀 모델은? 후자와 관련하여 ARIMA 또는 GARCH와 같은 대답이 즉시 명확하지 않은 까다로운 예제에 관심이 있습니다.

2
규칙 및 규칙이란 무엇입니까?
기계 학습을 공부하면서이 단어들을 점점 더 많이 듣고 있습니다. 실제로 일부 사람들은 규칙의 규칙에 따라 Fields 메달을 수상했습니다. 저는 이것이 통계 물리 / 수학에서 기계 학습에 이르는 용어라고 생각합니다. 당연히, 내가 요청한 많은 사람들이 직관적으로 설명 할 수 없었습니다. 나는 드롭 아웃과 같은 방법이 정규화에 도움이된다는 것을 알고 있습니다 (=> …

5
매우 많은 수의 데이터 포인트에서 값을 대치하는 방법은 무엇입니까?
데이터 세트가 매우 커서 약 5 %의 임의 값이 없습니다. 이 변수들은 서로 상관되어 있습니다. 다음 예제 R 데이터 세트는 더미 상관 데이터가있는 장난감 예제 일뿐입니다. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.