«standardization» 태그된 질문

일반적으로 "z- 표준화"는 평균과 단위 분산이 0이되도록 데이터를 이동하고 크기를 조정하는 것입니다. 다른 "표준화"도 가능합니다.


1
표준화 된 베타를 원래 변수로 다시 변환
나는 이것이 매우 간단한 질문이라는 것을 알고 있지만 검색 후 내가 찾고있는 답변을 찾을 수 없습니다. 베타의 능선 추정값을 계산하기 위해 변수 (릿지 회귀)를 실행하는 변수를 표준화 해야하는 문제가 있습니다. 그런 다음이를 원래 변수 척도로 다시 변환해야합니다. 하지만 어떻게해야합니까? 이변 량 사례에 대한 공식을 찾았습니다. β∗=β^SxSy.β∗=β^SxSy. \beta^* = \hat\beta \frac{S_x}{S_y} …

1
패널 데이터 모델의 그룹 내에서 표준화 된 종속 변수?
식별 그룹 내 종속 변수의 표준화가 의미가 있습니까? 다음 실무 논문 (법률 아마존에서 산림 파괴 둔화; 가격 또는 정책?, pdf )은 표준화 된 종속 변수를 사용하여 산림 파괴에 대한 브라질의 일반적인 정책 변경의 영향을 분석합니다. 표준화는 다음과 같이 수행됩니다. Ynewit=Yit−Yi¯¯¯¯¯sd(Yit)Yitnew=Yit−Yi¯sd(Yit) Y^{new}_{it} = \frac{Y_{it} - \overline{Y_i}}{sd(Y_{it})} 저자는 이것이 "시정촌 내의 삼림 …

5
독립 변수를 표준화하면 공선 성이 감소합니까?
Bayes / MCMC에 대한 좋은 글을 보았습니다. IT는 독립 변수를 표준화하면 MCMC (Metropolis) 알고리즘이 더 효율적일뿐만 아니라 (다중) 공선 성을 줄일 수 있다고 제안합니다. 사실일까요? 이것이 표준으로 해야 할 일입니까? (죄송합니다). Kruschke 2011, 베이지안 데이터 분석. (AP) 편집 : 예를 들어 > data(longley) > cor.test(longley$Unemployed, longley$Armed.Forces) Pearson's product-moment correlation data: …

4
비정규 데이터와 비정규 데이터로 Z 점수를 사용할 수 있습니까? [닫은]
폐쇄되었습니다 . 이 질문에는 세부 사항이나 명확성 이 필요 합니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 세부 사항을 추가하고 문제점을 명확하게하십시오 . 휴일 오년 전에 . 전체 사이클 시간의 일부를 비교하기 위해 일부 프로세스 사이클 시간 데이터 및 표준 z- 스코어를 사용한 스케일링 …



1
Anova ()와 drop1 ()이 GLMM에 다른 답변을 제공 한 이유는 무엇입니까?
GLMM 형식이 있습니다. lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 를 사용할 때 자동차 패키지 또는에서 사용할 때 drop1(model, test="Chi")와 다른 결과를 얻습니다 . 후자의 두 사람도 같은 대답을합니다.Anova(model, type="III")summary(model) 조작 된 데이터를 사용 하여이 두 가지 방법이 일반적으로 다르지 않다는 것을 알았습니다. …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
표준화 된 변수의 공분산은 상관 관계입니까?
기본적인 질문이 있습니다. 두 개의 임의 변수가 있다고 가정 해 봅시다.엑스엑스X 과 와이와이Y. 평균을 빼고 표준 편차로 나눠서 표준화 할 수 있습니다.엑스s t a n da r d나는 ze d=( X− E( X) )( SD ( X) )엑스에스티ㅏ엔디ㅏ아르 자형디나는지이자형디=(엑스−이자형(엑스))(에스디(엑스))X_{standardized} = \frac{(X - E(X))}{(SD(X))}. 상관 관계 엑스엑스X 과 와이와이Y, 씨o r …

1
KNN에 어떤 유형의 데이터 정규화를 사용해야합니까?
정규화에는 두 가지 이상의 유형이 있다는 것을 알고 있습니다. 예를 들어 1- z- 점수 또는 t- 점수를 사용하여 데이터 변환. 이것을 보통 표준화라고합니다. 2- 0에서 1 사이의 값을 갖도록 데이터 크기 조정 정규화가 필요한 경우 이제 질문 KNN에 어떤 유형의 데이터 정규화를 사용해야합니까? 그리고 왜?

1
상호 배타적이지 않은 카테고리를 분류 할 수있는 딥 러닝 모델
예 : 직업 설명에 "영국의 Java Senior Engineer"문장이 있습니다. 나는 2 개 종류로 예측하는 깊은 학습 모델을 사용하려면 : English 와 IT jobs. 기존 분류 모델을 사용하는 경우 softmax마지막 레이어에서 함수가있는 레이블 하나만 예측할 수 있습니다 . 따라서 두 모델 신경망을 사용하여 두 범주 모두에서 "예"/ "아니오"를 예측할 수 있지만 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
전처리 단계로 LDA를 사용할 때 기능 표준화
다중 등급 선형 판별 분석 (또는 다중 판별 분석이라고도 함)을 차원 축소 (또는 PCA를 통한 차원 축소 후 변환)에 사용하는 경우 일반적으로 "Z- 점수 정규화"(또는 표준화) 완전히 다른 스케일로 측정 되더라도 기능이 필요하지 않습니까? LDA에 이미 표준화 된 유클리드 거리를 암시하는 Mahalanobis 거리와 유사한 용어가 포함되어 있기 때문에? 따라서 꼭 …

6
R에서 변수를 그룹 중심으로 / 표준화하는 방법은 무엇입니까?
잠김 . 이 질문과 주제는 주제가 다르지만 역사적 의미가 있기 때문에이 질문과 답변은 잠겨 있습니다. 현재 새로운 답변이나 상호 작용을받지 않습니다. 익숙한 함수에는 기본 R의 배율 , ARM의 배율 조정이 포함 됩니다. 아마도 가장 좋은 방법은 그룹화 변수로 사용할 하나 이상의 변수를 지정하여 일부 변형 변형을 사용하는 것입니다.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.