«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

2
종속 변수의 측정 오차가 왜 결과에 치우 치지 않습니까?
독립 변수에 측정 오류가있는 경우 결과가 0에 대해 바이어스된다는 것을 이해했습니다. 종속 변수가 오류로 측정되면 표준 오류에만 영향을 미치지 만 이는 우리에게 의미가 없습니다. 원래 변수 아니라 다른 Y 와 오류 에 대한 의 영향 추정 . 그렇다면 어떻게 추정치에 영향을 미치지 않습니까? 이 경우 도구 변수를 사용하여이 문제를 제거 …

4
주요 관심 대상이 아닌 모든 변수를 로그 변환하지 않는 이유는 무엇입니까?
책과 토론에는 종종 예측 변수에 문제가있을 때 (몇 가지가 있음) 로그 변환이 가능하다는 내용이 있습니다. 저는 이것이 분포에 의존하고 예측 변수의 정규성은 회귀의 가정이 아니라는 것을 이해합니다. 그러나 로그 변환은 데이터의 균일 성을 높이고 특이 치의 영향을 덜받습니다. 나는 주요 interesr가 아닌 모든 연속 변수, 즉 내가 조정하는 변수를 로그 …

2
역 독립 변수를 사용한 회귀
종속 변수 의 벡터 와 독립 변수 의 벡터 가 있다고 가정 해 봅시다 . 가 에 대해 그려 질 때 , 둘 사이에 선형 관계 (상향 추세)가 있음을 알 수 있습니다. 이제 이것은 또한 와 사이에 선형 하향 추세가 있음을 의미합니다 .Y N X Y 1NNNYYYNNNXXXYYY YX1X1X\frac{1}{X}YYYXXX 이제 회귀 …

2
차이와의 개입
예를 들어 여기에서 논의 된 시계열 데이터 (일명 중단 된 시계열)를 사용하여 개입 분석을 수행 할 때 필요한 요구 사항 중 하나는 개입으로 인한 총 이득 (또는 손실)을 추정하는 것입니다. ). R 내에서 필터 함수를 사용하여 개입 함수를 추정하는 방법을 완전히 이해하지는 못했지만, 나는 그것이 어떤 상황에서도 작동하기에 충분히 일반적이기를 …

3
R에서 (또는 일반적으로) 회귀 계수를 특정 부호로 만들 수 있습니까?
실제 데이터를 사용하고 있으며 회귀 모델이 반 직관적 인 결과를 산출합니다. 일반적으로 나는 통계를 신뢰하지만 실제로 이러한 것들 중 일부는 사실이 될 수 없습니다. 내가보고있는 주요 문제는 실제로 하나의 변수가 증가하면 실제로는 음의 상관 관계가 있어야 응답이 증가한다는 것입니다. 각 회귀 계수에 대해 특정 부호를 강제하는 방법이 있습니까? 이 작업을 …


1
비정규 적으로 분포 된 오류가 우리의 중요성 설명의 유효성을 손상시키는 이유는 무엇입니까?
OLS 모델을 고려할 때 정규성 가정이 있으며 오류가 정규 분포를 따르는 것입니다. Cross Validated를 통해 탐색 해 왔으며 오류가 정상화되기 위해 Y와 X가 정상일 필요는없는 것 같습니다. 내 질문은 왜 우리가 비정규 적으로 분포 된 오류를 가질 때 우리의 중요성 진술의 유효성이 손상 되었는가? 신뢰 구간이 너무 넓거나 좁은 이유는 …

1
일반화 된 가산 모델에 대한 분산 팽창 계수
선형 회귀에 대한 일반적인 VIF 계산에서 각 독립 / 설명 변수 는 보통 최소 제곱 회귀 분석에서 종속 변수로 처리됩니다. 즉엑스제이엑스제이X_j 엑스제이= β0+ ∑i = 1 , i ≠ j엔β나는엑스나는엑스제이=β0+∑나는=1,나는≠제이엔β나는엑스나는 X_j = \beta_0 + \sum_{i=1, i \neq j}^n \beta_i X_i 값이 각각 저장되는 회귀 및 VIF 의해 결정 n아르 자형2아르 …

1
R에 공변량이있는 GARCH (1,1) 모형을 적합합니다
간단한 ARIMA 모델 등의 시계열 모델링 경험이 있습니다. 이제 변동성 클러스터링을 나타내는 일부 데이터가 있으며 데이터에 GARCH (1,1) 모델을 맞추는 것으로 시작하고 싶습니다. 데이터 시리즈와 영향을 미치는 여러 변수가 있습니다. 따라서 기본 회귀 용어로 다음과 같습니다. yt=α+β1xt1+β2xt2+ϵt.yt=α+β1xt1+β2xt2+ϵt. y_t = \alpha + \beta_1 x_{t1} + \beta_2 x_{t2} + \epsilon_t . 그러나 …
10 r  regression  garch 

1
교육 및 테스트 세트를 사용하여 회귀 모델의 성능을 평가하십니까?
테스트 세트를 보유하고 트레이닝 세트에서 모델을 훈련하여 분류 모델의 성능을 평가하는 것에 대해 종종 듣습니다. 그런 다음 예측 된 값과 실제 값을위한 2 개의 벡터를 만듭니다. 분명히 비교를 수행하면 F-Score, Kappa Statistic, Precision & Recall, ROC 곡선 등을 사용하여 예측력으로 모델의 성능을 판단 할 수 있습니다. 이것은 회귀와 같은 수치 …

1
이 두 회귀 모형의 근본적인 차이점은 무엇입니까?
중요한 상관 관계가있는 이변 량 반응이 있다고 가정합니다. 이 결과를 모델링하는 두 가지 방법을 비교하려고합니다. 한 가지 방법은 두 결과 간의 차이를 모델링 할 수있다 : 또 다른 방법을 사용하는 것 또는 이를 모델링 : ( Y I의 J = β 0 + 시간 + X ' β )(yi2−yi1=β0+X′β)(yi2−yi1=β0+X′β)(y_{i2}-y_{i1}=\beta_0+X'\beta)glsgee(yij=β0+time+X′β)(yij=β0+time+X′β)(y_{ij}=\beta_0+\text{time}+X'\beta) 다음은 …

2
강력한 회귀 추론 및 샌드위치 추정기
강력한 회귀 추론을 수행하기 위해 샌드위치 추정기를 사용하는 예를 들어 주시겠습니까? 에서 예제를 볼 수는 ?sandwich있지만 함수가 반환 한 분산 공분산 행렬을 사용하여 회귀 모델에서 발생 하는 추정 및 p 값으로 lm(a ~ b, data)( r 코딩) 방법으로 이동하는 방법을 이해하지 못합니다 . sandwich
10 r  regression  lm  sandwich 

3
이 큰 경우 중첩 이진 로지스틱 회귀 모델 비교
더 나은 내 질문을, 나는 16 변수 모델 (모두에서 출력의 일부를 제공 한 fit)과 17 변수 모델 ( fit2아래)을 (이러한 모델의 모든 예측 변수는이 모델 사이의 유일한 차이점은 그이고, 연속 fit하지 않습니다 변수 17 (var17) 포함) : fit Model Likelihood Discrimination Rank Discrim. Ratio Test Indexes Indexes Obs 102849 LR …

4
이 경우 x의 y에 대한 회귀가 x의 y보다 명확하게 더 낫습니까?
사람의 혈액 내 포도당 수준을 측정하는 데 사용되는 기기는 10 명의 무작위 표본에서 모니터링됩니다. 수준은 매우 정확한 실험실 절차를 사용하여 측정됩니다. 기기 측정은 x로 표시됩니다. 실험실 절차 측정 값은 y로 표시됩니다. 나는 개인적으로 실험실 판독 값을 예측하기 위해 기기 판독 값을 사용하기 때문에 x의 y가 더 정확하다고 생각합니다. x의 y는 …

3
탄성 그물과 관련된 혼란
나는 탄성 그물과 관련된이 기사를 읽고있었습니다. 그들은 우리가 단지 올가미를 사용하는 경우 상관 관계가 높은 예측 변수 중 하나만 선택하는 경향이 있기 때문에 탄력적 그물을 사용한다고 말합니다. 그러나 이것이 우리가 원하는 것이 아닙니다. 그것은 그것이 다중 공선 성 문제에서 우리를 구원한다는 것을 의미합니다. 어떤 제안 / 설명?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.