«association-measure» 태그된 질문

상관 관계보다 더 일반적인 개념 인 변수 간의 연관성 측정

3
예 : 이진 결과에 glmnet을 사용하는 LASSO 회귀
관심있는 결과가 이분법 인 LASSO Regressionglmnet 과 함께 사용하기 시작했습니다 . 아래에 작은 모의 데이터 프레임을 만들었습니다. age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


1
거대한 희박한 비상 대표를 시각화하는 방법?
약물 이름 (DN)과 이에 해당하는 이상 반응 (AE)이라는 두 가지 변수가 있는데, 이는 다 대다 관계에 있습니다. 33,556 개의 약물 이름과 9,516 개의 부작용이 있습니다. 표본 크기는 약 580 만 개의 관측치입니다. DN과 AE의 연관성 / 관계를 연구하고 이해하고 싶습니다. 그림을 보는 것이 더 낫기 때문에 R 에서이 세트를 시각화하는 …



1
Biplot / loading 플롯에서 PCA 구성 요소와 변수의 적절한 연관 측정은 무엇입니까?
FactoMineR측정 데이터 세트를 잠재 변수로 줄이기 위해 사용 하고 있습니다. 내가 해석하는 위의 변수 맵은 분명하지만, 변수의지도를 찾고 변수와 구성 요소 1 사이의 연관에 올 때 나는 혼란 스러워요, ddp그리고 cov매우 가까운 맵의 구성 요소이며, ddpAbs조금 더있다 떨어져. 그러나 이것은 상관 관계가 보여주는 것이 아닙니다. $Dim.1 $Dim.1$quanti correlation p.value jittAbs …

2
많은 셀의 주파수가 5 미만인 경우 카이-제곱 검정의 적용 가능성
동료의 지원 (독립 변수)과 작업 만족도 (의존 변수) 사이의 연관성을 찾기 위해 카이 제곱 테스트를 적용하고 싶습니다. 동료의 지원은 지원 범위에 따라 네 그룹으로 분류됩니다. 1 = 매우 적은 범위, 2 = 일부, 3 = 대부분, 4 = 매우 업무 만족도는 두 가지로 분류됩니다 : 0 = 만족 및 1 …

2
서수와 연속 랜덤 변수 사이의 비강도 연관 강도 측정
내가받은 문제를 여기에 던지고 있습니다. 두 개의 임의 변수가 있습니다. 하나는 연속적 이며 (Y) 다른 하나는 이산 적이며 서수 (X) 로 접근 합니다. 쿼리와 함께받은 줄거리 아래에 넣었습니다. 데이터를 보낸 사람 은 X와 Y 사이 의 연관 강도 를 측정 하려고합니다 . 데이터를 생성 한 프로세스에 대한 가정이 먼저 나오지 …

1
속성이 공칭 일 때 개인을위한 최적의 거리 기능은 무엇입니까?
명목 형 (정렬되지 않은 범주 형) 속성의 경우 개인간에 어떤 거리 기능을 사용해야하는지 모르겠습니다. 나는 교과서를 읽고 있었고 Simple Matching 기능 을 제안 했지만 일부 책은 공칭을 이진 속성으로 변경하고 Jaccard Coefficient 를 사용해야한다고 제안합니다 . 그러나 명목 속성의 값이 2가 아닌 경우 어떻게해야합니까? 해당 속성에 3-4 개의 값이 있으면 …

3
범주 형 변수의 대중적이거나 일반적인 조합을 찾기 위해 사용할 수있는 통계적 방법은 무엇입니까?
polydrug 사용에 관한 연구를하고 있습니다. 400 명의 마약 중독자에 대한 데이터 세트가 있는데, 이들은 각각 자신이 남용하는 약물을 언급했습니다. 10 가지가 넘는 약물이 있으므로 가능한 큰 조합이 있습니다. 나는 그들이 소비하는 약물의 대부분을 이진 변수로 기록했다. 2 가지 또는 3 가지 약물의 대중적이거나 일반적인 조합을 찾고 싶습니다. 사용할 수있는 통계적 …

2
이분법과 연속 변수의 상관 관계
이분법과 연속 변수 사이의 상관 관계를 찾으려고합니다. 이것에 대한 나의 기초 연구에서 나는 독립적 인 t- 검정을 사용해야한다는 것을 발견했으며 그에 대한 전제 조건은 변수의 분포가 정상이어야한다는 것입니다. 나는 정규성을 테스트하기 위해 Kolmogorov-Smirnov 테스트를 수행했으며 연속 변수가 비정규이며 비대칭 적이라는 것을 알았습니다 (약 4,000 데이터 포인트). 나는 모든 변수 범위에 …

13
'B에 A가 주어질 가능성이 높으면'A에 B가 주어 졌을 가능성이 더 높습니다
나는 더 분명한 직관을 얻으려고 노력하고 있습니다. AAA 만든다 BBB 그때보다 BBB 만든다 AAA 더 가능성이 ""즉 허락하다 n(S)n(S)n(S) 공간의 크기를 나타냅니다 AAA 과 BBB 그렇다면 청구: P(B|A)>P(B)P(B|A)>P(B)P(B|A)>P(B) 그래서 n(AB)/n(A)>n(B)/n(S)n(AB)/n(A)>n(B)/n(S)n(AB)/n(A) > n(B)/n(S) 그래서 N ( B ) / N ( B ) > N ( ) / N ( S)n(AB)/n(B)>n(A)/n(S)n(AB)/n(B) …

3
행렬 곱셈을 사용하여 이진 데이터에 대한 Jaccard 또는 기타 연관 계수 계산
행렬 곱셈을 사용하여 Jaccard 계수를 계산할 수있는 방법이 있는지 알고 싶습니다. 이 코드를 사용했습니다 jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x))) jaccard <- as.data.frame(m) for(i in 1:ncol(x)) { for(j in i:ncol(x)) { jaccard[i,j]= length(which(x[,i] & x[,j])) / length(which(x[,i] | x[,j])) jaccard[j,i]=jaccard[i,j] } } 이것은 R에서 …

2
혼합 모델을위한 파라 메트릭, 세미 파라 메트릭 및 비 파라 메트릭 부트 스트랩
이 기사 에서 다음과 같은 이식편을 가져옵니다 . 부트 스트랩을 사용하고 R boot패키지가있는 선형 혼합 모델을 위해 파라 메트릭, 반 파라 메트릭 및 비 파라 메트릭 부트 스트랩 부트 스트랩을 구현하려고 초보자 입니다. R 코드 내 R코드 는 다음과 같습니다 . library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.