«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

1
변수 모형에서 오차가없는 것보다 더 나은 결과를 달성하는 회귀에 대한 편향 추정기
일부 연구를 위해 Error In Variable 모델에 대한 일부 구문 데이터를 연구하고 있습니다. 현재 단일 독립 변수가 있으며 종속 변수의 실제 값에 대한 분산을 알고 있다고 가정합니다. 따라서이 정보를 사용하여 종속 변수의 계수에 대한 편견 추정량을 얻을 수 있습니다. 모델: , Y=0.5(X)-(10)+E(2)여기서, E1~N(0,σ2)일부σ예2~N(0,1)엑스~= x + e1x~=x+e1\tilde{x} = x + e_1 …

3
왜의 추적
모델 에서 정규 방정식을 사용하여 를 추정 할 수 있습니다 .β와이= Xβ+ ϵy=Xβ+ϵ{y} = X \beta + \epsilonββ\beta Y =X β .β^= ( X'엑스)− 1엑스'와이,β^=(X′X)−1X′y,\hat{\beta} = (X'X)^{-1}X'y, 우리가 얻을 수있는와이^= Xβ^.y^=Xβ^.\hat{y} = X \hat{\beta}. 잔차 벡터는 다음과 같이 추정됩니다. ϵ^= y− Xβ^= ( 난− X( X'엑스)− 1엑스') y= Q y= …

3
최대 가능성 또는 한계 가능성 중 어느 것이 더 좋은가?
회귀 분석을 수행하는 동안 다음과 같은 정의로 가면 : 부분 우도, 프로파일 우도 및 한계 우도의 차이점은 무엇입니까? 그 최우 L 극대화 찾기 β 및 θ (β, θ | 데이터). , Marginal Likelihood 우리는 β에 조건부 θ의 확률 분포를 식별 할 수 있다는 사실을 이용하여 가능성 방정식에서 θ를 통합합니다. 더 …

1
R : 선형 모형 잔차의 정규성을 테스트-사용할 잔차
정규성을 확인하기 위해 선형 모형의 잔차에 대해 Shapiro Wilk의 W 검정 및 Kolmogorov-Smirnov 검정을 수행하고 싶습니다. 원시 잔차, Pearson 잔차, 학생 잔차 또는 표준화 잔차에 대해 어떤 잔차를 사용해야하는지 궁금합니다. Shapiro-Wilk의 W 테스트의 경우 원시 및 Pearson 잔차에 대한 결과는 동일하지만 다른 결과는 그렇지 않은 것으로 보입니다. fit=lm(mpg ~ 1 …

2
회귀를 피팅 할 때 직교 다항식을 사용하지 않는 이유가 있습니까?
일반적으로 고차 변수로 회귀를 피팅 할 때 직교 다항식을 사용하지 않는 것이 더 좋은지 궁금합니다. 특히 R을 사용하는 것이 궁금합니다. 만약 poly()에 raw = FALSE같은 장착 값을 생성 poly()과 raw = TRUE, 그리고 poly함께 raw = FALSE해결할 수있는 문제 다항식 회귀와 관련된 문제 중 일부는 다음해야 poly()와 raw = FALSE …

1
R의 lm ()이 교과서와 다른 계수 추정치를 반환하는 이유는 무엇입니까?
배경 모델 피팅에 대한 과정에서 첫 번째 예 를 이해하려고합니다 (따라서 간단하게 보일 수 있습니다). 손으로 계산을 수행했으며 예제와 일치하지만 R에서 반복하면 모델 계수가 해제됩니다. 차이점은 모집단 분산 ( )을 사용하는 교과서 때문일 수 있다고 생각 했지만 R은 샘플 분산 ( )을 사용하고있을 수 있지만 계산에서 사용되는 위치를 볼 수는 …
13 r  regression  self-study  lm 

3
부분 최소 제곱 (PLS) 회귀의 모형 가정
PLS 회귀 가정 (단일 ) 에 관한 정보를 찾으려고합니다 . 특히 OLS 회귀의 가정과 관련하여 PLS의 가정을 비교하는 데 관심이 있습니다. yyy 나는 PLS의 주제에 관한 많은 문헌을 읽거나 훑어 보았다. Wold (Svante and Herman), Abdi 등의 논문이 있지만 만족스러운 자료를 찾지 못했습니다. Wold et al. (2001) PLS- 회귀 : …

1
모형에 척도 데이터가 적합했을 때 예측을하기 위해 새로운 관측치를 축척하는 방법
선형 회귀 모델에 사용하기 위해 데이터 매트릭스를 스케일링하는 개념을 이해합니다. 예를 들어 R에서는 다음을 사용할 수 있습니다. scaled.data <- scale(data, scale=TRUE) 내 유일한 질문은 출력 값을 예측하려는 새로운 관찰에 대해 어떻게 정확하게 스케일링되는 것입니까? 그럴까요 scaled.new <- (new - mean(data)) / std(data)?

1
차단의 표준 오차가 왜 가 0에서 증가 합니까?
절편 용어의 표준 오차 ( )에서 주어진다 여기서 는 의 평균 의., Y=β1X+β0+εSE( β 0)2=σ2[1β^0β^0\hat{\beta}_0y=β1x+β0+εy=β1x+β0+εy=\beta_1x+\beta_0+\varepsilonˉxxi에스이자형( β^0)2= σ2[ 1엔+ x¯2∑엔나는 = 1( x나는− x¯)2]SE(β^0)2=σ2[1n+x¯2∑i=1n(xi−x¯)2]SE(\hat{\beta}_0)^2 = \sigma^2\left[\frac{1}{n}+\frac{\bar{x}^2}{\sum_{i=1}^n(x_i-\bar{x})^2}\right]엑스¯x¯\bar{x}엑스나는xix_i 내가 이해 한 바에 따르면, SE는 불확실성을 정량화합니다. 예를 들어 표본의 95 %에서 에는 실제 이 포함됩니다 . 로 불확실성의 척도 인 SE가 어떻게 증가하는지 …

1
일반화 선형 모형의 기하학적 해석
선형 모델의 경우 : 우리는 OLS를 통해 추정 모델의 좋은 기하학적 해석 할 수 있습니다 Y = X β + 전자 . Y는 공간은 x와 잔류에 의해 스팬 (Y)의 투영이다 즉 ,이 공간 (X)에 의해 스팬에 수직이다.y=xβ+ey=xβ+ey=x\beta+ey^=xβ^+e^y^=xβ^+e^\hat{y}=x\hat{\beta}+\hat{e}y^y^\hat{y}e^e^\hat{e} 이제 내 질문은 : 일반화 선형 모델 (로지스틱 회귀, Poission, 생존)에 대한 기하학적 …

1
MLE 및 OLS 사용
정규 최소 제곱 대신 최대 가능성 추정을 사용하는 것이 언제 바람직한가요? 각각의 장점과 한계는 무엇입니까? 일반적인 상황에서 각각을 사용할 위치에 대한 실용적인 지식을 수집하려고합니다.


2
선형 대 비선형 회귀
이론적으로 지수 적으로 관련된 및 값 세트가 있습니다 .y엑스xx와이yy 와이= X비y=axby = ax^b 계수를 구하는 한 가지 방법은 양쪽에 자연 로그를 적용하고 선형 모형을 피팅하는 것입니다. > fit <- lm(log(y)~log(x)) > a <- exp(fit$coefficients[1]) > b <- fit$coefficients[2] 이것을 얻는 또 다른 방법은 이론적 인 시작 값 세트가 주어지면 비선형 …

1
별도의 모델링 / 검증 세트를 사용하여 회귀 모델을 작성할 때 검증 데이터를 "재순환"하는 것이 적절합니까?
모델링 / 검증 관찰간에 80/20 분할이 있다고 가정합니다. 모델을 모델링 데이터 세트에 적합 시켰으며 유효성 검증 데이터 세트에서보고있는 오류에 익숙합니다. 향후 관측 값을 채점하기 위해 모델을 롤아웃하기 전에 유효성 검사를 모델링 데이터와 다시 결합하여 100 % 데이터에 대한 매개 변수 추정치를 업데이트하는 것이 적절합니까? 나는 이것에 대한 두 가지 관점을 …

1
패널 데이터 모델의 그룹 내에서 표준화 된 종속 변수?
식별 그룹 내 종속 변수의 표준화가 의미가 있습니까? 다음 실무 논문 (법률 아마존에서 산림 파괴 둔화; 가격 또는 정책?, pdf )은 표준화 된 종속 변수를 사용하여 산림 파괴에 대한 브라질의 일반적인 정책 변경의 영향을 분석합니다. 표준화는 다음과 같이 수행됩니다. Ynewit=Yit−Yi¯¯¯¯¯sd(Yit)Yitnew=Yit−Yi¯sd(Yit) Y^{new}_{it} = \frac{Y_{it} - \overline{Y_i}}{sd(Y_{it})} 저자는 이것이 "시정촌 내의 삼림 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.