«covariance» 태그된 질문

공분산은 두 변수 사이의 선형 관계의 강도와 방향을 측정하는 데 사용되는 양입니다. 공분산은 규모가 정해지지 않기 때문에 종종 해석하기가 어렵습니다. 변수의 SD에 의해 스케일링되면 Pearson의 상관 계수가됩니다.

2
주성분 분석을 비정규 데이터에 사용할 수 있습니까?
나는 기계 학습을위한 기계 학습 책에 주어진 예를 읽고 있습니다. 먼저 예를 자세히 설명한 다음 내 질문에 대해 이야기하겠습니다. 예 : 25 년간의 주가 10 년 동안 데이터 세트를 가져옵니다. 25 주가로 PCA를 운영합니다. 주성분을 다우 존스 지수와 비교합니다. PC와 DJI의 유사성이 매우 높습니다! 내가 이해 한 바에 따르면,이 예는 …

2
조건부 독립성 및 그래픽 표현 관련
공분산 선택을 연구 할 때 한 번 다음 예제를 읽었습니다. 다음 모델과 관련하여 : 공분산 행렬과 역공 분산 행렬은 다음과 같습니다. 와 y 의 독립성이 왜 역공 분산에 의해 결정 되는지 이해가되지 않습니까?엑스xx와이yy 이 관계의 기본이되는 수학적 논리는 무엇입니까? 또한, 다음 그림의 왼쪽 그래프는 와 y 사이의 독립 관계를 캡처한다고 …

1
Anova ()와 drop1 ()이 GLMM에 다른 답변을 제공 한 이유는 무엇입니까?
GLMM 형식이 있습니다. lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 를 사용할 때 자동차 패키지 또는에서 사용할 때 drop1(model, test="Chi")와 다른 결과를 얻습니다 . 후자의 두 사람도 같은 대답을합니다.Anova(model, type="III")summary(model) 조작 된 데이터를 사용 하여이 두 가지 방법이 일반적으로 다르지 않다는 것을 알았습니다. …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
역공 분산 행렬에 대한 가설 검정
I 관찰 가정 IID 및 테스트하고자 VECH A의 순응 행렬 및 벡터 . 이 문제에 대한 알려진 작업이 있습니까?H 0 : A ( Σ - 1 ) = a A axi∼N(μ,Σ)xi∼N(μ,Σ)x_i \sim \mathcal{N}\left(\mu,\Sigma\right)H0:A H0:A H_0: A\ ( Σ− 1) =a(Σ−1)=a\left(\Sigma^{-1}\right) = aㅏAAㅏaa 명백한 (나에게) 시도는 가능성 비율 테스트를 통해 이루어 …

1
표준화 된 변수의 공분산은 상관 관계입니까?
기본적인 질문이 있습니다. 두 개의 임의 변수가 있다고 가정 해 봅시다.엑스엑스X 과 와이와이Y. 평균을 빼고 표준 편차로 나눠서 표준화 할 수 있습니다.엑스s t a n da r d나는 ze d=( X− E( X) )( SD ( X) )엑스에스티ㅏ엔디ㅏ아르 자형디나는지이자형디=(엑스−이자형(엑스))(에스디(엑스))X_{standardized} = \frac{(X - E(X))}{(SD(X))}. 상관 관계 엑스엑스X 과 와이와이Y, 씨o r …

1
점근 공분산 행렬이란 무엇입니까?
점근 공분산 행렬이 모수 추정값의 공분산 행렬과 동일하다는 것이 사실입니까? 그렇지 않다면 무엇입니까? 이 경우 공분산 행렬과 점근 공분산 행렬의 차이점은 무엇입니까? 미리 감사드립니다!

1
R 선형 회귀 범주 형 변수 "숨김"값
이것은 여러 번 나온 예제 일뿐이므로 샘플 데이터가 없습니다. R에서 선형 회귀 모델 실행 : a.lm = lm(Y ~ x1 + x2) x1연속 변수입니다. x2범주 형이며 "낮음", "중간"및 "높음"의 세 가지 값이 있습니다. 그러나 R이 제공하는 출력은 다음과 같습니다. summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
PCA를 통한 마할 라 노비스 거리
나는 행렬을 가지고 있는데, 여기서 는 유전자의 수이고 은 환자의 수입니다. 그러한 데이터로 작업 한 사람은 가 항상 보다 크다는 것을 알고 있습니다. 기능 선택을 사용하여 를 더 합리적인 수로 줄 였지만 는 여전히 보다 큽니다 .n × pn×pn\times p피pp엔nn피pp엔nn피pp피pp엔nn 나는 그들의 유전자 프로필을 기반으로 환자의 유사성을 계산하고 싶습니다; 유클리드 …

2
선형 모델에서 공간 공분산을 어떻게 설명 할 수 있습니까?
배경 두 블록 각각에 4 개의 치료 수준과 6 개의 복제물이있는 현장 연구의 데이터가 있습니다. (4x6x2 = 48 개의 관측치) 블록은 약 1 마일 떨어져 있으며 블록 내에 42, 2m x 4m 플롯 그리드와 1m 너비의 산책로가 있습니다. 내 연구는 각 블록에 24 개의 플롯 만 사용했습니다. 공간 공분산을 평가하고 …

1
상호 배타적이지 않은 카테고리를 분류 할 수있는 딥 러닝 모델
예 : 직업 설명에 "영국의 Java Senior Engineer"문장이 있습니다. 나는 2 개 종류로 예측하는 깊은 학습 모델을 사용하려면 : English 와 IT jobs. 기존 분류 모델을 사용하는 경우 softmax마지막 레이어에서 함수가있는 레이블 하나만 예측할 수 있습니다 . 따라서 두 모델 신경망을 사용하여 두 범주 모두에서 "예"/ "아니오"를 예측할 수 있지만 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
관찰 된 이벤트와 예상 된 이벤트를 비교하는 방법은 무엇입니까?
4 가지 가능한 이벤트의 주파수 샘플이 하나 있다고 가정합니다. Event1 - 5 E2 - 1 E3 - 0 E4 - 12 내 이벤트의 예상 확률이 있습니다. p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 내 네 가지 사건의 관측 빈도의 합으로 (18) 사건의 예상 빈도를 올바르게 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

2
이 데이터 집합에 공분산이없는 이유는 무엇입니까?
공분산의 작동 방식에 대한 이해는 상관 관계가있는 데이터의 공분산이 다소 높아야한다는 것입니다. 산점도에 표시된 것처럼 데이터가 상관 관계가 있지만 공분산이 거의 0에 가까운 상황을 겪었습니다. 상관 관계가있는 데이터의 공분산은 어떻게 0이 될 수 있습니까? import numpy as np x1 = np.array([ 0.03551153, 0.01656052, 0.03344669, 0.02551755, 0.02344788, 0.02904475, 0.03334179, 0.02683399, 0.02966126, …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.