«multivariate-analysis» 태그된 질문

한 번에 둘 이상의 변수가 함께 분석되는 위치를 분석하고 이러한 변수는 종속 (응답) 또는 분석에서 유일한 변수입니다. 이는 "다중"또는 "다중 변수"분석과 대조 될 수 있으며, 이는 둘 이상의 예측 변수 (독립) 변수를 의미합니다.

1
GBM 패키지와 GBM을 사용하는 Caret
을 사용하여 모델 튜닝을 수행 caret했지만 gbm패키지를 사용하여 모델을 다시 실행했습니다 . caret패키지가 사용 gbm하고 출력이 동일해야한다는 것을 이해합니다 . 그러나 data(iris)RMSE와 R ^ 2를 평가 지표로 사용하면 약 5 %의 모델에서 불일치가 발생합니다. 부분 종속성 플롯을 사용 하기 위해 최적의 모델 성능을 찾고 caret싶지만 다시 실행 하고 싶습니다 gbm. …

2
두 개의 다변량 분포가 동일한 기본 모집단에서 표본 추출되는지 여부를 어떻게 테스트합니까?
두 개의 다변량 데이터 세트가 제공되고 이전과 새 데이터 세트가 있으며 동일한 프로세스 (모델이 없음)로 생성되었지만 아마도 수집 / 생성 라인을 따라 어딘가에 있다고 가정하십시오. 데이터에 문제가 생겼습니다. 예를 들어 기존 데이터에 대한 유효성 검사 세트 또는 기존 데이터에 추가 할 때 새 데이터를 사용하고 싶지 않을 것입니다. Wilcoxon 순위 …


2
데이터에 가우시안 분포가있는 경우 몇 개의 샘플을 특성화합니까?
단일 차원으로 분포 된 가우시안 데이터는이를 특성화하기 위해 두 개의 매개 변수가 필요하며 (평균, 분산), 약 30 개의 무작위로 선택된 샘플이 일반적으로 이러한 매개 변수를 합리적으로 높은 신뢰도로 추정하기에 충분하다는 소문이 있습니다. 그러나 차원 수가 증가하면 어떻게됩니까? 2 차원 (예 : 높이, 무게)에서 "최적의"타원을 지정하려면 5 개의 매개 변수가 필요합니다. …

3
매개 변수화 공분산 행렬이있는 양의 k 차원 사분면에 대한 분포는 무엇입니까?
부정적인 시뮬레이션에 대한 그의 문제에 대한 zzk 의 질문 에 이어 , 공분산 행렬 를 설정할 수있는 양의 k 차원 사분면 에서 매개 변수화 된 분포 패밀리가 무엇인지 궁금합니다 . ΣRk+R+k\mathbb{R}_+^kΣΣ\Sigma zzk 에서 설명한 것처럼 의 분포에서 시작 하여 선형 변환 적용하면 작동하지 않습니다. X⟶ Σ 1 / 2 (X-μ)+μRk+R+k\mathbb{R}_+^kX⟶Σ1/2(X−μ)+μX⟶Σ1/2(X−μ)+μX …

2
분할 도표 분산 분석 : R의 모형 비교 테스트
R에서 X및 M인수 와 함께 사용하기에 적합한 모델 비교를 사용하여 Split-Plot ANOVA에서 효과를 테스트하려면 anova.mlm()어떻게해야합니까? 저는 ?anova.mlmDalgaard (2007)에 익숙합니다 [1]. 불행히도 Split-Plot Design 만 브러시합니다. 이를 위해 두 가지 개체-내 요인이있는 완전 무작위 설계에서이를 수행합니다. N <- 20 # 20 subjects total P <- 3 # levels within-factor 1 Q …

1
표본 공분산 행렬이 되돌릴 수없는 경우 어떻게해야합니까?
주어진 d- 차원 벡터 클러스터에 대해 다변량 정규 분포를 가정하고 샘플 d- 차원 평균 벡터와 샘플 공분산 행렬을 계산하는 몇 가지 클러스터링 기술을 연구하고 있습니다. 그런 다음 보이지 않는 새로운 d- 차원 벡터가이 클러스터에 속하는지 결정하려고 할 때이 측정을 통해 거리를 확인합니다. ( X나는− μ^엑스)'σ^− 1엑스( X나는− μ^엑스) > B0.95( …

1
다변량 시계열에 대한 블록 부트 스트랩 대체
현재 R에서 다변량 시계열을 부트 스트랩하는 데 다음 프로세스를 사용합니다. 블록 크기 결정- 각 시리즈에 대한 블록 크기를 생성하는 패키지 에서 기능 b.star을 실행하십시오.np 최대 블록 크기 선택 tsboot선택한 블록 크기를 사용하여 모든 시리즈에서 실행 부트 스트랩 출력의 인덱스를 사용하여 다변량 시계열 재구성 누군가가 블록 부트 스트랩의 대안으로 meboot 패키지를 …



4
MANOVA와 종속 변수 사이의 상관 관계 : 너무 강합니까?
MANOVA의 종속 변수는 "너무 강하게 상관되지 않아야"합니다. 그러나 상관 관계가 너무 강합니까? 이 문제에 대한 사람들의 의견을 얻는 것이 흥미로울 것입니다. 예를 들어 다음과 같은 상황에서 MANOVA를 진행 하시겠습니까? Y1 및 Y2는 및 와 상관 관계가있다p &lt; 0.005r = 0.3아르 자형=0.3r=0.3p &lt; 0.005피&lt;0.005p<0.005 Y1 및 Y2는 및 와 상관됩니다.p = …

3
다차원 시계열을 이용한 개입 분석
시간이 지남에 따라 주류 판매에 대한 정책 결정 결과를 수량화하기 위해 개입 분석을 수행하고 싶습니다. 그러나 시계열 분석에 익숙하지 않으므로 초보자 질문이 있습니다. 문헌을 조사한 결과 다른 연구자들은 ARIMA를 사용하여 알코올의 시계열 판매량을 모형화했으며, 회귀 변수로 더미 변수를 사용하여 중재 효과를 모델링 한 것으로 나타났습니다. 이것이 합리적인 접근 방법 인 …

1
R / mgcv : te () 및 ti () 텐서 제품이 다른 표면을 생성하는 이유는 무엇입니까?
mgcv에 대한 패키지는 R텐서 제품의 상호 작용을 피팅에 대한 두 가지 기능이 있습니다 : te()와 ti(). 나는 둘 사이의 기본 노동 분열을 이해한다 (비선형 상호 작용에 적합하고이 상호 작용을 주요 효과와 상호 작용으로 분해). 내가 이해할 수없는 것은 왜 te(x1, x2)와 ti(x1) + ti(x2) + ti(x1, x2)(약간) 다른 결과가 발생할 …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
소프트 임계 값 대 올가미 벌점
지금까지 고차원 데이터 세트를 사용하여 불이익을받은 다변량 분석에서 이해 한 내용을 요약하려고하지만 소프트 임계 값 대 Lasso (또는 ) 불이익에 대한 적절한 정의를 얻는 데 어려움을 겪고 있습니다.L1L1L_1 보다 정확하게는, 희소 한 PLS 회귀 분석을 사용하여 게놈 데이터 ( 단일 뉴클레오티드 다형성 , 우리는 수치 변수로 간주되는 {0,1,2} 범위의 작은 …

3
선형 판별 분석 (LDA)의 스케일링 값을 사용하여 선형 판별에 설명 변수를 그릴 수 있습니까?
주성분 분석을 통해 얻은 Biplot 값을 사용하여 각 주성분을 구성하는 설명 변수를 탐색 할 수 있습니다. 선형 판별 분석에서도 가능합니까? 제공된 데이터는 "Edgar Anderson의 홍채 데이터"( http://en.wikipedia.org/wiki/Iris_flower_data_set )입니다. 홍채 데이터 는 다음과 같습니다 . id SLength SWidth PLength PWidth species 1 5.1 3.5 1.4 .2 setosa 2 4.9 3.0 1.4 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.