«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

2
베이지안 최적화를위한 GP 회귀 분석에서 조건부 공분산 행렬
배경과 문제 회귀 및 후속 베이지안 최적화 (BO)에 가우시안 프로세스 (GP)를 사용하고 있습니다. 회귀를 위해 MATLAB 용 gpml 패키지를 여러 가지 맞춤형 수정과 함께 사용 하지만 문제는 일반적입니다. 입력 공간에서 두 개의 훈련 입력이 너무 가까울 때 공분산 행렬이 확실하지 않을 수 있습니다 (이 사이트에는 이에 대한 몇 가지 질문이 …

1
귀무 가설 하에서 결정 계수
이 텍스트의 첫 페이지 하단에 아르 자형2a d j u s t e dRadjusted2R^2_\mathrm{adjusted} 조정에 관한 진술이 궁금합니다. 아르 자형2a d j u s t e d= 1 - ( 1 - R2) ( n - 1n - m - 1) .Radjusted2=1−(1−R2)(n−1n−m−1).R^2_\mathrm{adjusted} =1-(1-R^2)\left({\frac{n-1}{n-m-1}}\right). 텍스트 상태는 다음과 같습니다. 조정의 논리는 다음과 …

4
문제가 선형 회귀에 적합하다는 결론
Montgomery, Peck 및 Vining의 선형 회귀 분석 소개를 사용하여 선형 회귀를 배우고 있습니다. 데이터 분석 프로젝트를 선택하고 싶습니다. 설명 회귀 변수와 반응 변수 사이에 선형 기능 관계가 있다고 의심되는 경우에만 선형 회귀가 적합하다는 순진한 생각을했습니다. 그러나 많은 실제 응용 프로그램이이 기준을 충족시키는 것 같지는 않습니다. 그러나 선형 회귀는 매우 널리 …


3
홀드 아웃 방법 (데이터를 교육 및 테스트로 분할)이 기존 통계에 사용되지 않는 이유는 무엇입니까?
교실에서 데이터 마이닝에 노출 할 때 모델 성능을 평가하는 방법으로 홀드 아웃 방법이 도입되었습니다. 그러나 선형 모델에서 첫 수업을 들었을 때 이것은 모델 검증 또는 평가의 수단으로 소개되지 않았습니다. 저의 온라인 조사에서도 교차점이 보이지 않습니다. 고전 통계에서 홀드 아웃 방법이 사용되지 않는 이유는 무엇입니까?

3
선형 회귀 분석에 사용되는 가우스 기본 함수 매개 변수 이해
가우스 기저 함수를 선형 회귀 구현에 적용하고 싶습니다. 불행히도 기본 기능의 몇 가지 매개 변수를 이해하는 데 어려움을 겪고 있습니다. 구체적으로 μμ\mu 및 σσ\sigma 입니다. 내 데이터 세트는 10,000 x 31 행렬입니다. 10,000 개의 샘플과 31 개의 기능. "각 기본 함수는 입력 벡터 x를 스칼라 값으로 변환합니다"를 읽었습니다. 따라서 x는 …

2
정규 분포 X와 Y는 정규 분포 잔차를 더 많이 발생합니까?
여기서 선형 회귀 분석에서 정규성의 가정에 대한 잘못된 해석이 논의되고 ( '정규'는 잔차가 아닌 X 및 / 또는 Y를 나타냄) 포스터는 정규 분포가 아닌 X와 Y를 가질 수 있는지 묻습니다. 여전히 정규 분포 잔차가 있습니다. 내 질문은 : 정규 분포 X와 Y 가 정규 분포 잔차를 초래할 가능성 이 더 …

5
매우 많은 수의 데이터 포인트에서 값을 대치하는 방법은 무엇입니까?
데이터 세트가 매우 커서 약 5 %의 임의 값이 없습니다. 이 변수들은 서로 상관되어 있습니다. 다음 예제 R 데이터 세트는 더미 상관 데이터가있는 장난감 예제 일뿐입니다. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
예측 간격으로 확률 론적 진술을 할 수 있습니까?
사이트에서 신뢰 구간과 예측 구간의 해석에 관한 많은 훌륭한 토론을 읽었지만 한 가지 개념은 여전히 ​​약간 수수께끼입니다. OLS 프레임 워크를 고려하고 우리는 피팅 모델 획득 한 Y = X β를 . 우리는 x *를 받았으며 그 반응을 예측하도록 요청 받았다. 우리는 계산 X * T의 β를 보너스로, 우리는 또한 우리의 …


4
회귀 잔차 분포 가정
오류에 대한 분포 가정을 배치해야하는 이유, 즉 yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , .ϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) 왜 쓰지 않습니까 yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , ,yi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) 어느 경우 든 입니다. 나는 분포 가정이 데이터가 아니라 설명이 아닌 오류에 관한 것이라고 강조했다 . ϵi=yi−y^ϵi=yi−y^\epsilon_i = y_i - \hat{y} 나는이 …

1
로지스틱 회귀 분석을위한 모자 매트릭스 정보
모자 매트릭스의 대각선에있는 값이 선형 회귀에 대해 제공하는 정보는 여러 사이트에서 명확하게 설명되어 있습니다. 로지스틱 회귀 모델의 모자 행렬은 명확하지 않습니다. 선형 회귀를 적용하는 모자 행렬에서 얻은 정보와 동일합니까? 이것은 CV의 다른 주제에서 찾은 모자 매트릭스의 정의입니다 (소스 1). H=VX(X′VX)−1X′VH=VX(X′VX)−1X′VH=VX ( X'V X)^-1 X' V X의 경우 예측 변수의 벡터이고 …

1
종속 변수에 "컷오프"가있는 경우 모델링
내가 사용하는 용어가 틀린 경우 사전에 사과하십시오. 정정을 환영합니다. "잘라 내기"라고 부르는 내용이 다른 이름으로 바뀌면 알려 주시면 질문을 업데이트 할 수 있습니다. 내가 관심있는 상황은 이것입니다. 독립 변수 xx\bf{x} 와 단일 종속 변수 yyy 있습니다. 모호하게 남겨 두 겠지만, 이러한 변수에 대해 좋은 회귀 모델을 얻는 것이 비교적 간단하다고 …

5
재귀 (온라인) 정규화 된 최소 제곱 알고리즘
누구든지 Tikhonov 정규화 (정규 최소 제곱)에 대한 온라인 (재귀) 알고리즘의 방향을 알려 줄 수 있습니까? 오프라인 설정에서 n-fold cross validation을 사용하여 λ 를 찾은 원래 데이터 세트를 사용하여 β^=(XTX+λI)−1XTYβ^=(XTX+λI)−1XTY\hat\beta=(X^TX+λI)^{−1}X^TY 를 계산 합니다. y = x ^ T \ hat \ beta를 사용하여 주어진 x에 대해 새로운 y 값을 예측할 수 …

2
원시 데이터에 대해 회귀와 같은 모델 가정을 테스트하고 나머지에 대해 다른 사람들이 테스트하는 이유는 무엇입니까?
저는 실험 심리학 박사 과정 학생이며 데이터 분석 방법에 대한 기술과 지식을 향상시키기 위해 열심히 노력합니다. 심리학에서 5 년째까지 회귀 형 모델 (예 : 분산 분석)은 다음과 같은 사항을 가정한다고 생각했습니다. 데이터의 정규성 데이터에 대한 분산 동질성 학부 과정에서 데이터에 대한 가정이 있다고 믿게되었습니다. 그러나 5 학년 때, 일부 강사들은 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.