«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

3
두 경사의 차이를 계산하는 방법은 무엇입니까?
두 줄이 (거의) 평행인지 이해하는 방법이 있습니까? 선형 회귀에서 생성 된 두 개의 선이 있으며 평행한지 이해하고 싶습니다. 다시 말해, 나는이 두 선의 경사를 다르게하고 싶습니다. 이것을 계산하는 R 함수가 있습니까? 편집 : ... 그리고 어떻게 선형 회귀선의 경사 (도)를 얻을 수 있습니까?

1
R에서 AIC ()와 extractAIC ()의 차이점은 무엇입니까?
어느 쪽이든 R 문서는 그다지 밝지 않습니다. 이 링크 에서 얻을 수있는 것은 둘 중 하나를 사용하는 것이 좋습니다. 내가 얻지 못하는 것은 왜 그들이 평등하지 않은지입니다. 사실 : R의 단계적 회귀 함수는를 step()사용합니다 extractAIC(). 흥미롭게도 R의 'mtcars'데이터 세트 에서 lm()모델과 glm()'null'모델 (인터셉트 만)을 실행하면 AIC및에 대한 결과가 다릅니다 extractAIC(). …

2
“X에서 오류”모델이 더 널리 사용되지 않는 이유는 무엇입니까?
회귀 계수의 표준 오차를 계산할 때 설계 행렬 의 무작위성을 고려하지 않습니다 . 예를 들어 OLS에서는 를엑스XXvar ( β^)var(β^)\text{var}(\hat{\beta})var ( ( X티엑스)− 1엑스티와이) = σ2( X티엑스)− 1var((XTX)−1XTY)=σ2(XTX)−1\text{var}((X^TX)^{-1}X^TY) = \sigma^2(X^TX)^{-1} 경우 무작위로 간주되었다, 총 분산의 법은 어떤 의미에서의 분산의 추가 기여를 요구할 것 뿐만 아니라. 즉엑스XX엑스XX var ( β^) = var …

2
KKT를 사용하여
참고 문헌에 따르면 1 권 , 2 권 과 종이 . 정규화 된 회귀 (Ridge, LASSO 및 Elastic Net)와 제약 조건 간에는 동등한 내용이 언급되어 있습니다. Cross Validated 1 및 Cross Validated 2 도 살펴 보았지만 그 동등성 또는 논리에 대한 명확한 답변을 볼 수는 없습니다. 내 질문은 Karush–Kuhn–Tucker (KKT)를 …

3
데이터가 선형이 아닌 경우 선형 회귀가 중요 할 수 있습니까?
선형 회귀 분석을 수행하여 중요한 결과를 얻었지만 산점도에서 선형성을 검사했을 때 데이터가 선형임을 확신하지 못했습니다. 산점도를 검사하지 않고 선형성을 테스트하는 다른 방법이 있습니까? 선형 회귀가 선형이 아닌 경우 중요 할 수 있습니까? [산점도를 포함하도록 편집]
11 regression 

2
다항식 회귀 (MLR)에 대한 신뢰 구간의 모양 이해
다항식 회귀의 신뢰 구간 모양을 파악하기가 어렵습니다. 여기서 인공 . 왼쪽 그림은 UPV (비 스케일 예측 분산)를 나타내고 오른쪽 그래프는 신뢰 구간과 X = 1.5, X = 2 및 X = 3에서 측정 된 (인공) 점을 보여줍니다.와이^= a + b ⋅ X+ c ⋅ X2와이^=ㅏ+비⋅엑스+씨⋅엑스2\hat{Y}=a+b\cdot X+c\cdot X^2 기본 데이터의 세부 …

1
GLM 매개 변수에 대한 추론을 위해 자유도 보정을 사용해야합니까?
이 질문은 Martijn의 답변 에서 영감을 얻었습니다 . 이항 또는 포아송 모델과 같은 하나의 매개 변수 패밀리에 대해 GLM을 적합하고 그것이 완전 유사성 절차라고 가정합니다 (quasipoisson과 반대). 그런 다음 분산은 평균의 함수입니다. 이항식 : 및 Poisson var [ X ] = E [ X ] .var[X]=E[X]E[1−X]var[X]=E[X]E[1−X]\text{var}[X] = E[X]E[1-X]var[X]=E[X]var[X]=E[X]\text{var}[X] = E[X] …


2
이 회귀 분석 분산 분석표가 동일한 이유는 무엇입니까?
같은 Y와 3 단계 X의 두 회귀가 있습니다. 각 그룹 또는 X 수준에서 n = 5 인 전체 n = 15입니다. 첫 번째 회귀는 X를 범주 형으로 취급하여 지표 변수를 수준이있는 수준 2와 3에 할당합니다. 하나는 참조입니다. 표시기 / 인형은 다음과 같습니다. 레벨 = 2 인 경우 X1 = 1, …
11 regression  anova 

4
인공 신경망 다항식 특징을 갖는 선형 회귀와 동일합니까?
신경망에 대한 이해와 다른 기계 학습 알고리즘에 비해 그 이점을 향상시키고 싶습니다. 내 이해는 다음과 같으며 내 질문은 다음과 같습니다. 내 이해를 수정하고 보완 할 수 있습니까? :) 내 이해 : (1) 인공 신경망 = 입력 값에서 출력 값을 예측하는 함수입니다. Universal Approximation Theorem ( https://en.wikipedia.org/wiki/Universal_approximation_theorem ) 에 따르면 , …

2
데이터를 시험과 훈련으로 나누는 것이 순전히 "통계"인가?
나는 기계 학습 / 데이터 과학을 공부하는 물리학 학생 이므로이 질문이 충돌을 시작한다는 의미는 아닙니다.) 그러나 물리 학부 프로그램의 대부분은 실험실 / 실험을 수행하는 것입니다. 이는 많은 데이터를 의미합니다. 처리 및 통계 분석. 그러나 물리학 자들이 데이터를 다루는 방식과 데이터 과학 / 통계 학습서가 데이터를 다루는 방식 사이에는 큰 차이가 …

1
융기 부분과 올가미가 각각 잘 수행되지만 다른 계수를 생성 할 때 결과를 해석하는 방법
Lasso와 Ridge를 모두 사용하여 회귀 모델을 실행 중입니다 (0-5 범위의 이산 결과 변수 예측). 모델을 실행하기 전에 기능 세트를 250 에서 25 로 줄이는 SelectKBest방법을 사용 합니다. 초기 피처를 선택하지 않으면 Lasso와 Ridge는 정확도 점수가 낮아집니다 (샘플 크기가 작은 600 일 수 있음). 또한 일부 기능은 서로 관련되어 있습니다.scikit-learn 모델을 …

2
직교 적으로 할 수 없다면 생식으로하십시오 (다항식 회귀)
에 대해 대한 다항식 회귀 분석을 수행 할 때 때때로 사람들은 원시 다항식, 때로는 직교 다항식을 사용합니다. 그러나 그들이 완전히 임의적 인 것처럼 보이는 것을 사용할 때.X와이와이Y엑스엑스X 여기 에서 여기에 원시 다항식이 사용됩니다. 그러나 여기 와 여기 에서 직교 다항식은 올바른 결과를 제공하는 것으로 보입니다. 왜, 어떻게, 왜?! 반면에 교과서 …

2
축소가 영리한 방식으로 적용되는 경우 더 효율적인 추정기에서 항상 더 잘 작동합니까?
I 두 추정기 있다고 가정 과 같은 파라미터의 일관성 추정기 것을 그러한 저 와 의 PSD 감각. 따라서 은 보다 효율적 입니다. 이 두 추정기는 서로 다른 손실 함수를 기반으로합니다. β 2β0√βˆ1β^1\widehat{\beta}_1βˆ2β^2\widehat{\beta}_2β0β0\beta_0V1≤V2 β 1 β 2엔−−√( βˆ1− β0) →디엔( 0 , V1) ,엔−−√( βˆ2− β0) →디엔( 0 , V2)n(β^1−β0)→dN(0,V1),n(β^2−β0)→dN(0,V2)\sqrt{n}(\widehat{\beta}_1 -\beta_0) …

3
비대칭 데이터를 사용한 회귀
인구 통계 및 서비스에서 방문수를 계산하려고합니다. 데이터가 매우 왜곡되어 있습니다. 히스토그램 : qq 플롯 (왼쪽은 로그) : m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) city및 service요인 변수입니다. 모든 변수에 대해 낮은 p 값 ***을 얻지 만 r의 제곱도 .05입니다. 어떻게해야합니까? 지수 또는 다른 것과 같은 다른 모델이 작동합니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.