«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

2
Hosmer-Lemeshow 테스트에서 의 자유도
로지스틱 회귀 모형의 적합도 (GOF)에 대한 Hosmer-Lemeshow 검정 (HLT) 의 검정 통계량 은 다음과 같이 정의됩니다. 그런 다음 샘플은 deciles, 로 분할되며 , decile 당 다음 수량을 계산합니다.d=10d=10d=10D1,D2,…,DdD1,D2,…,DdD_1, D_2, \dots , D_{d} O1d=∑i∈DdyiO1d=∑i∈DdyiO_{1d}=\displaystyle \sum_{i \in D_d} y_i , 즉 decile 에서 관찰 된 긍정적 인 사례 수 ;DdDdD_d O0d=∑i∈Dd(1−yi)O0d=∑i∈Dd(1−yi)O_{0d}=\displaystyle \sum_{i …

4
(왜) 과적 합 된 모델이 큰 계수를 갖는 경향이 있습니까?
변수에 대한 계수가 클수록 모델이 해당 차원에서 "스윙"할 수있는 능력이 커지고 잡음에 대한 기회가 증가한다고 생각합니다. 모델의 분산과 큰 계수 사이의 관계에 대한 합리적인 감각을 가지고 있다고 생각하지만 왜 과적 합 모델에서 발생 하는지에 대한 감각은 없습니다 . 이들이 과적 합의 증상이며 계수 수축이 모형의 분산을 줄이는 기술이라고 말하는 것이 …

1
L1 정규화를 사용한 회귀는 Lasso와 동일하고 L2 정규화를 사용한 회귀는 능선 회귀와 동일합니까? 그리고 "올가미"를 쓰는 방법?
저는 특히 Andrew Ng의 기계 학습 과정을 통해 소프트웨어 엔지니어 학습 기계 학습 입니다 . 정규화로 선형 회귀를 연구하는 동안 혼란스러운 용어를 발견했습니다. L1 정규화 또는 L2 정규화를 사용한 회귀 올가미 릿지 회귀 그래서 내 질문 : L1 정규화를 사용한 회귀는 LASSO와 정확히 동일합니까? L2 정규화를 사용한 회귀는 릿지 회귀와 …

2
선형 회귀 분석에서 신뢰 구간의 모양 및 계산 이해
OLS 선형 회귀와 관련된 곡선 모양의 신뢰 대역의 원점과 회귀 매개 변수 (경사 및 절편)의 신뢰 구간과 관련이있는 방법을 이해하려고합니다 (예 : R 사용). require(visreg) fit <- lm(Ozone ~ Solar.R,data=airquality) visreg(fit) 밴드는 2.5 % 절편 및 97.5 % 기울기와 97.5 % 절편 및 2.5 % 기울기로 계산 된 선의 한계와 …

2
부분 최소 제곱 회귀의 이론
SVD와 PCA를 이해하는 사람을 위해 부분 최소 제곱 회귀 (온라인에서 사용 가능) 뒤에 이론을 잘 설명 할 수 있습니까? 온라인에서 여러 출처를 살펴본 결과 엄격하고 접근성이 올바른 조합을 찾지 못했습니다. zi=Xφizi=Xφiz_i=X \varphi_iyTziyTzi y^Tz_i ∥φi∥=1‖φi‖=1\|\varphi_i\|=1zTizj=0ziTzj=0z_i^Tz_j=0i≠ji≠ji \neq j여기서 는 공분산을 최대화하는 순서대로 반복적으로 선택됩니다. 그러나 내가 읽은 후에도 나는 그것이 사실인지 여부와 …


4
정도를 낮추는 대신 다항식 회귀 분석에서 정규화를 사용하는 이유는 무엇입니까?
예를 들어, 회귀를 수행 할 때 선택할 두 개의 하이퍼 매개 변수는 종종 함수의 용량 (예 : 다항식의 최대 지수)과 정규화 량입니다. 내가 혼동하는 것은 왜 저용량 기능을 선택한 다음 정규화를 무시하지 않는 것입니까? 그렇게하면 과잉 적합하지 않습니다. 정규화와 함께 고용량 기능이있는 경우 저용량 기능을 사용하고 정규화하지 않는 것과 동일하지 …


1
R이 NA를 lm () 계수로 반환하는 이유는 무엇입니까?
나는 피팅하고있다 lm()(Q4에게 기본을, Q1, Q2, Q3) 금융 분기 지표를 포함하는 데이터 세트에 모델. 사용 lm(Y~., data = data) 내가 얻을 NAQ3에 대한 계수, 하나 개의 변수가 있기 때문에 특이성의 제외 것을 경고한다. Q4 열을 추가해야합니까?
32 r  regression 

7
"실행"선형 또는 로지스틱 회귀 매개 변수를 계산하는 알고리즘이 있습니까?
http://www.johndcook.com/standard_deviation.html의 "정확하게 실행 분산 계산"이라는 논문 은 실행 평균, 분산 및 표준 편차를 계산하는 방법을 보여줍니다. 선형 또는 로지스틱 회귀 모델의 매개 변수가 각각의 새로운 훈련 레코드가 제공 될 때 유사하게 "동적으로"업데이트 될 수있는 알고리즘이 있습니까?

1
“판정 계수”와“평균 제곱 오차”의 차이점은 무엇입니까?
회귀 문제의 경우 사람들이 "결정 계수"(일명 R 제곱)를 사용하여 정규화에 적합한 페널티 계수를 찾는 등의 모델 선택을 수행하는 것을 보았습니다. 그러나 회귀 정확도의 척도로 "평균 제곱 오류"또는 "근 평균 제곱 오류"를 사용하는 것도 일반적입니다. 이 둘의 주요 차이점은 무엇입니까? 그것들은 "정규화"와 "회귀"태스크를 위해 상호 교환 적으로 사용될 수 있습니까? 그리고 …

1
회귀를위한 CNN 아키텍처?
입력이 이미지이고 레이블이 80과 350 사이의 연속적인 값인 회귀 문제를 연구하고 있습니다. 이미지는 반응 후 일부 화학 물질입니다. 밝혀지는 색은 남은 다른 화학 물질의 농도를 나타내며 모델이 출력하는 것입니다-화학 물질의 농도. 이미지를 회전, 뒤집기, 대칭시킬 수 있으며 예상 출력은 여전히 ​​동일해야합니다. 이러한 종류의 분석은 실제 실험실에서 수행됩니다 (매우 전문화 된 …

2
로지스틱 회귀 : Scikit Learn 및 Statsmodels
이 두 라이브러리의 로지스틱 회귀 출력에서 ​​다른 결과를 얻는 이유를 이해하려고합니다. 나는 idre UCLA에서 데이터 세트 사용하고 자습서를 예측, admit기반 gre, gpa그리고 rank. rank는 범주 형 변수로 취급되므로 먼저 rank_1삭제 된 더미 변수로 변환됩니다 . 절편 열도 추가됩니다. df = pd.read_csv("https://stats.idre.ucla.edu/stat/data/binary.csv") y, X = dmatrices('admit ~ gre + gpa + …

2
OLS 선형 회귀 분석의 비용 함수
기계 학습에 대한 Coursera의 Andrew Ng가 제공 한 선형 회귀에 대한 강의와 약간 혼동됩니다. 거기서 그는 다음과 같이 제곱합을 최소화하는 비용 함수를 제공했습니다. 12m∑i=1m(hθ(X(i))−Y(i))212m∑i=1m(hθ(X(i))−Y(i))2 \frac{1}{2m} \sum _{i=1}^m \left(h_\theta(X^{(i)})-Y^{(i)}\right)^2 나는 1을 이해1212\frac{1}{2} 에서 온. 제곱 항에서 도함수를 수행 할 때 제곱 항의 2가 반으로 취소되도록 그렇게했다고 생각합니다. 그러나 나는1을이해하지 못한다.1m1m\frac{1}{m} 왔습니다. …

1
음 이항 회귀 문제-모형이 좋지 않습니까?
카운트 데이터의 회귀 모델에 대한 Sellers and Shmueli 의 매우 흥미로운 기사를 읽고 있습니다. 처음에 그들은 (p. 944) McCullaugh와 Nelder (1989)를 인용하여 부정적인 이항 회귀는 인기가없고 문제적인 정식 연관성이 있다고 말했다. 나는 언급 된 구절을 발견했고 그것을 말한다 (M과 N의 374 쪽) "응용 프로그램에서 마이너스 이항 분포를 거의 사용하지 않은 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.