«weighted-data» 태그된 질문

5
머신 러닝에서 계층 적 / 중첩 된 데이터를 처리하는 방법
예를 들어 내 문제를 설명하겠습니다. {나이, 성별, 국가, 지역, 도시}와 같은 속성이 주어진 개인의 소득을 예측한다고 가정합니다. 당신은 이와 같은 훈련 데이터 세트를 가지고 있습니다 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

2
가중 분산의 바이어스 보정
가중 분산 용 는 평균 동일한 데이터로부터 추정 될 때, 상기 바이어스 샘플 분산을 수정이 존재한다 : Var ( X) : = 1엔∑나는( x나는− μ )2바르(엑스): =1엔∑나는(엑스나는−μ)2\text{Var}(X):=\frac{1}{n}\sum_i(x_i - \mu)^2Var ( X) : = 1n - 1∑나는( x나는− E[ X] )2바르(엑스): =1엔−1∑나는(엑스나는−이자형[엑스])2\text{Var}(X):=\frac{1}{n-1}\sum_i(x_i - E[X])^2 가중 평균과 분산을 조사하고 가중 분산에 대한 …

2
불균형 데이터에 대한 로지스틱 회귀에 가중치 추가
불균형 데이터 (9 : 1)로 로지스틱 회귀를 모델링하려고합니다. glmR 의 함수에서 가중치 옵션을 시도하고 싶었지만 100 % 확실하지 않습니다. 내 출력 변수가 c(0,0,0,0,0,0,0,0,0,1)입니다. 이제 "1"의 무게를 10 배 더 늘리고 싶습니다. 그래서 가중치 인수를 제공합니다 weights=c(1,1,1,1,1,1,1,1,1,1,1,10). 그렇게하면 최대 가능성을 계산할 때 고려됩니다. 내가 맞아? "1"의 오 분류는 "0"의 오 분류보다 …

2
가중 주성분 분석
몇 가지 검색을 한 후에, 나는 관측 분동 / 측정 오차를 주요 성분 분석에 포함시키는 것에 대해 거의 발견하지 못했습니다. 내가 찾은 것은 가중치를 포함하기 위해 반복적 인 접근 방식에 의존하는 경향이 있습니다 (예 : here ). 내 질문은 왜이 접근법이 필요한가? 가중 공분산 행렬의 고유 벡터를 사용할 수없는 이유는 …

1
가중 분산, 한 번 더
편향되지 않은 가중 분산은 이미 여기 와 다른 곳에서 해결 되었지만 여전히 놀라운 양의 혼란이있는 것 같습니다. Wikipedia 기사 뿐만 아니라 첫 번째 링크에 제시된 공식에 대한 합의가있는 것으로 보인다 . 이것은 또한 R, Mathematica 및 GSL (MATLAB 제외)에서 사용하는 공식처럼 보입니다. 그러나 Wikipedia 기사에는 가중 분산 구현에 대한 훌륭한 …

1
가중 상관과 같은 것?
가장 인기있는 음악가들에 대한 흥미로운 데이터가 위치별로 나누어 약 200 개의 의회 구역으로 나뉘어 있습니다. 나는 음악적 취향에 따라 사람을 조사 할 수 있고 "민주당처럼 들리는 지"또는 "공화당처럼 들리는 지"를 결정할 수 있는지 알고 싶다. (당연히 이것은 가벼운 마음이지만 데이터에는 실제 엔트로피가 있습니다!) 지난 3 번의 선거주기 동안 각 지구에서 …

1
가중 최소 제곱 가중치 정의 : R lm 함수 대.
아무도 왜 매트릭스 연산으로 R가중치가 가장 작은 제곱 과 수동 솔루션 에서 다른 결과를 얻고 있는지 말해 줄 수 있습니까? 특히 수동으로 해결하려고합니다. W A x = W bWAx=Wb\mathbf W \mathbf A\mathbf x=\mathbf W \mathbf b, 어디 여W\mathbf W 가중치의 대각선 행렬입니다. ㅏA\mathbf A 데이터 매트릭스입니다. 비b\mathbf b 반응 벡터입니다. …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.