«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

2
잔차 이분산성 측정
이 위키 백과 링크 에는 OLS 잔차 이분산성을 감지하는 여러 기술이 나열되어 있습니다. 이분산성에 영향을받는 영역을 감지하는 데 어떤 실습 기술이 더 효율적인지 알고 싶습니다. 예를 들어, 여기 OLS '잔여량 대 적합치'그림의 중앙 영역이 그림의 측면보다 더 높은 분산을 갖는 것으로 나타났습니다 (사실은 확실하지 않지만 문제의 경우라고 가정하겠습니다). 확인하기 위해 …

3
잔차의 크기로 데이터 세트를 계층화하고 2- 표본 비교를 수행하는 것이 전혀 방어력이 있습니까?
이것은 내가 일종의 ad-hoc 방법으로 수행하는 것으로 보이며 매우 비린 것처럼 보이지만 아마도 뭔가를 놓치고 있습니다. 다중 회귀 분석 에서이 작업을 수행했지만 간단하게 유지합시다. yi=β0+β1xi+εiyi=β0+β1xi+εi y_{i} = \beta_{0} + \beta_{1} x_{i} + \varepsilon_{i} 이제 적합 모형에서 잔차를 가져옵니다. ei=yi−(β^0+β^1xi)ei=yi−(β^0+β^1xi) e_{i} = y_{i} - \left( \hat{\beta}_{0} + \hat{\beta}_{1} x_{i} \right) 잔차의 …


2
패널 / 세로 데이터를 사용하여 회귀 데이터를 표준화하는 것이 좋은 방법입니까?
일반적으로 계수를 올바르게 비교하기 위해 회귀 분석에서 독립 변수를 표준화합니다 (이렇게하면 동일한 단위 (표준 편차)를 갖습니다). 그러나 패널 / 세로 데이터를 사용하면 특히 계층 적 모델을 추정 할 때 데이터를 어떻게 표준화해야하는지 잘 모르겠습니다. 그것이 잠재적 인 문제가 될 수있는 이유를 보려면, 개인이 t = 1 , … , T …

2
선형 모형에서 결과 집계 R
회귀 모델링은 종종 과학보다 "예술"이기 때문에 회귀 구조의 여러 반복을 테스트하는 경우가 종종 있습니다. "최상의"모델을 찾기 위해 이러한 여러 모델 실행의 정보를 요약하는 효율적인 방법은 무엇입니까? 내가 사용한 한 가지 접근 방식은 모든 모델을 목록에 넣고 해당 목록을 실행 summary()하는 것입니다.하지만 비교하는 더 효율적인 방법이 있다고 생각합니까? 샘플 코드 및 …
16 r  regression 


1
로지스틱 회귀-다중 공선 성 문제 / 함정
로지스틱 회귀 분석에서 OLS 회귀 분석과 마찬가지로 다중 공선성에 대해 우려 할 필요가 있습니까? 예를 들어, 다중 공선 성이 존재하는 로지스틱 회귀 분석을 사용하면 베타 계수에서 추론 할 때주의해야합니다 (OLS 회귀 분석에서와 같이)? OLS 회귀 분석의 경우 높은 다중 공선성에 대한 하나의 "수정"은 능선 회귀입니다. 로지스틱 회귀 분석과 같은 것이 …

2
로지스틱 회귀 분석의 Pearson VS 편차 잔차
표준화 된 Pearson 잔차는 전통적인 확률 론적 방식으로 얻어진다는 것을 알고 있습니다. ri=yi−πiπi(1−πi)−−−−−−−−√ri=yi−πiπi(1−πi) r_i = \frac{y_i-\pi_i}{\sqrt{\pi_i(1-\pi_i)}} 이탈 잔차는보다 통계적인 방법 (각 지점의 가능성에 대한 기여도)을 통해 얻습니다. di=si−2[yilogπi^+(1−yi)log(1−πi)]−−−−−−−−−−−−−−−−−−−−−−−−−−√di=si−2[yilog⁡πi^+(1−yi)log⁡(1−πi)] d_i = s_i \sqrt{-2[y_i \log \hat{\pi_i} + (1 - y_i)\log(1-\pi_i)]} 여기서, 경우 (1) = Y 난 = 1과 s의 난 = -1 …

1
고차원 회귀 : 왜 특별합니까?
고차원 회귀 영역에 대한 연구를 읽으려고 노력하고 있습니다. 경우 보다 큰 이며, . 이 용어처럼 보인다 회귀 추정량에 대한 수렴 속도 측면에서 종종 나타납니다.피피p엔엔nP > > N피>>엔p >> n로그p / n로그⁡피/엔\log p/n 예를 들어, 여기서 식 (17)은 올가미 적합 가 β^β^\hat{\beta}1엔∥ Xβ^− Xβ∥22= O피( σ로그피엔−−−−−√∥ β∥1).1엔”엑스β^−엑스β”22=영형피(σ로그⁡피엔”β”1). \dfrac{1}{n}\|X\hat{\beta} - X \beta\|_2^2 …

3
베타 분포와 로지스틱 회귀 모형의 관계는 무엇입니까?
내 질문은 : 베타 분포 와 로지스틱 회귀 모델 의 계수 사이의 수학적 관계는 무엇입니까 ? 설명하기 : 로지스틱 (시그 모이 드) 기능은 f(x)=11+exp(−x)f(x)=11+exp⁡(−x)f(x) = \frac{1}{1+\exp(-x)} 로지스틱 회귀 모델에서 확률을 모델링하는 데 사용됩니다. 하자 이분법 수 득점 결과와 디자인 매트릭스. 로지스틱 회귀 모델은AAA(0,1)(0,1)(0,1)XXX P(A=1|X)=f(Xβ).P(A=1|X)=f(Xβ).P(A=1|X) = f(X \beta). 참고 는 상수 …

1
부분 최소 제곱, 감소 된 순위 회귀 및 주요 구성 요소 회귀 간의 연결은 무엇입니까?
감소 된 순위 회귀 및 주성분 회귀는 부분 최소 제곱의 특별한 경우입니까? 이 튜토리얼 (6 페이지의 "목표 비교")에서는 X 또는 Y를 투영하지 않고 부분 최소 제곱을 수행 할 때 (즉, "부분이 아님") 해당 등급이 감소하거나 주성분 회귀가 감소한다고 설명합니다. 이 SAS 설명서 페이지 , "감소 된 순위 회귀"및 "방법 간의 …


1
음이 아닌 제로 팽창 연속 데이터를 모델링하는 방법은 무엇입니까?
현재 family = gaussian0보다 낮은 값을 가질 수 없으며 0으로 팽창하고 연속적 인 생물 다양성의 지표에 선형 모델 ( ) 을 적용하려고합니다 . 값의 범위는 0에서 0.25를 약간 상회합니다. 결과적으로, 내가 제거하지 못한 모델의 잔차에는 분명한 패턴이 있습니다. 누구든지 이것을 해결하는 방법에 대한 아이디어가 있습니까?

3
판별 분석 대 로지스틱 회귀
판별 분석에 대한 전문가를 찾았으며 이에 대한 질문이 있습니다. 그래서: 클래스가 잘 분리되면 로지스틱 회귀에 대한 모수 추정값이 놀랍게 불안정합니다. 계수가 무한대로 될 수 있습니다. LDA는이 문제로 고통받지 않습니다. 피처 수가 적고 예측 변수 의 분포가 각 클래스에서 대략 정규이면 선형 판별 모델은 로지스틱 회귀 모델보다 더 안정적입니다.엑스엑스X 안정성이란 무엇이며 …

1
“긴장 올가미”가 표준 올가미와 다른 이유는 무엇입니까?
데이터 세트 시작하여 올가미를 적용하고 솔루션 β L을 구하면 데이터 세트 ( X S , Y )에 올가미를 다시 적용 할 수 있습니다 . 여기서 S 는 0이 아닌 세트입니다. ''LLASO ''솔루션이라고 불리는 솔루션 β R L 을 얻기 위해 β L의 색인 (내가 틀렸다면 나를 교정하십시오!) 솔루션 β L …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.