«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

2
신경 네트워크 대 다른 모든 것
Google 에서 이것에 대한 만족스러운 답변을 찾지 못했습니다 . 물론 내가 가진 데이터가 수백만 정도라면 딥 러닝이 길입니다. 그리고 빅 데이터가 없으면 기계 학습에 다른 방법을 사용하는 것이 좋습니다. 주어진 이유는 과적 합입니다. 기계 학습 : 즉 데이터, 특징 추출, 수집 된 것으로부터 새로운 특징 만들기 등 상관 관계가 큰 …

1
Newey-West (1987)와 Hansen-Hodrick (1980)의 비교
질문 : Newey-West (1987)와 Hansen-Hodrick (1980) 표준 오류 사용의 주요 차이점과 유사점은 무엇입니까? 어떤 상황에서 이들 중 하나가 다른 상황보다 선호되어야합니까? 노트: 각 조정 절차가 어떻게 작동하는지 알고 있습니다. 그러나 온라인이나 교과서에서 비교할 문서를 아직 찾지 못했습니다. 참조를 환영합니다! Newey-West는 "캐치 올 (catch-all)"HAC 표준 오류로 사용되는 반면 Hansen-Hodrick은 중복 된 …

2
로지스틱 회귀 분석을위한 행렬 표기법
선형 회귀 (제곱 손실)에서 행렬을 사용하면 목표에 대해 매우 간결한 표기법이 있습니다. minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 여기서 AAA 는 데이터 행렬이고 xxx 는 계수이고 bbb 는 반응입니다. 로지스틱 회귀 목표에 대해 유사한 행렬 표기법이 있습니까? 내가 본 모든 표기법은 모든 데이터 포인트 ( \ sum _ {\ text data} \ …

2
R의 단계적 회귀-어떻게 작동합니까?
step 함수를 사용하여 R의 단계별 회귀와 역 회귀의 기본 차이점을 이해하려고합니다. 단계별 회귀 분석을 위해 다음 명령을 사용했습니다. step(lm(mpg~wt+drat+disp+qsec,data=mtcars),direction="both") 위의 코드에 대한 아래 출력이 있습니다. 뒤로 변수 선택을 위해 다음 명령을 사용했습니다. step(lm(mpg~wt+drat+disp+qsec,data=mtcars),direction="backward") 그리고 나는 뒤로 출력을 얻었습니다. 내가 아는 한, 매개 변수가 지정되지 않은 경우 매개 변수 "upper"및 "lower"가 …
15 r  regression 

3
“모든 관련 예측 변수”를 포함시켜야합니까?
추론에 회귀 모델을 사용하는 기본 가정은 "모든 관련 예측 변수"가 예측 방정식에 포함되어 있다는 것입니다. 중요한 실제 요인을 포함하지 않으면 계수가 바이어스되어 부정확 한 추론 (즉, 변수 바이어스 생략)이 발생한다는 이론적 근거가 있습니다. 그러나 연구 관행에서 "모든 관련 예측 변수" 와 유사한 것을 포함한 사람 은 본 적이 없습니다 . …

3
선형 분류기의 경우 더 큰 계수가 더 중요한 특징을 의미합니까?
기계 학습을 담당하는 소프트웨어 엔지니어입니다. 내 이해에서 선형 회귀 (예 : OLS) 및 선형 분류 (예 : 로지스틱 회귀 및 SVM)는 훈련 된 계수 와 특징 변수 사이의 내부 곱을 기반으로 예측합니다 .승⃗ 승→\vec{w}엑스⃗ 엑스→\vec{x} 와이^= f( 승⃗ ⋅ x⃗ ) = f( ∑나는승나는엑스나는)와이^=에프(승→⋅엑스→)=에프(∑나는승나는엑스나는) \hat{y} = f(\vec{w} \cdot \vec{x}) = …

1
가장 잘 맞는 라인이 있습니다. 가장 적합한 라인을 변경하지 않는 데이터 포인트가 필요합니다
피팅 라인에 대한 프레젠테이션을하고 있습니다. 간단한 선형 함수 와이= 1 x + b와이=1x+by=1x+b 있습니다. 내 선이 동일한 방정식에 가장 잘 맞는 분산 형 그림에 넣을 수있는 분산 된 데이터 포인트를 얻으려고합니다. 이 기술을 R 또는 Excel 중 더 쉬운 방법으로 배우고 싶습니다.

3
스플라인 vs 가우시안 프로세스 회귀
가우시안 프로세스 회귀 (GPR)는 유연한 비선형 모델을 피팅하기 위해 스플라인을 사용하는 대신 사용할 수 있습니다. 어떤 상황에서 특히 베이지안 회귀 프레임 워크에서 어떤 상황이 다른 상황보다 더 적합한 지 알고 싶습니다. 이미 살펴 봤습니다 스플라인, 스무딩 스플라인 및 가우시안 프로세스 에뮬레이터의 장점과 단점은 무엇입니까? 그러나이 게시물에는 GPR에 아무것도없는 것 같습니다.

1
여러 선형 모델에서 관계를 시각적으로 표현하는 가장 좋은 방법
저는 약 6 개의 예측 변수가있는 선형 모형을 가지고 있으며 추정치, F 값, p 값 등을 제시 할 것입니다. 그러나 단일 예측 변수의 개별 효과를 나타내는 가장 좋은 시각적 도표가 무엇인지 궁금했습니다. 응답 변수? 산포도? 조건부 플롯? 효과도? 기타? 그 음모를 어떻게 해석합니까? R 에서이 작업을 수행하므로 가능하면 예제를 자유롭게 …

2
R에서 더미 코딩 대신 효과 코딩으로 회귀를 수행하는 방법은 무엇입니까?
현재 범주 형 / 요인 변수 만 독립 변수로 사용하는 회귀 모델을 작성 중입니다. 내 종속 변수는 로짓 변환 비율입니다. R이 "인자"유형 인 즉시 인형을 코딩하는 방법을 자동으로 알기 때문에 R에서 정상적인 회귀를 실행하는 것은 매우 쉽습니다. 그러나 이러한 유형의 코딩은 또한 각 변수에서 하나의 범주가 기준으로 사용되어 해석하기 어렵다는 …



4
R에서 관측치 및 / 또는 예측 변수를 추가 할 때 선형 회귀를 효율적으로 업데이트
관측치 또는 예측 변수를 추가 할 때 선형 모델을 효율적으로 업데이트하기 위해 R에서 방법을 찾는 데 관심이 있습니다. biglm에는 관측치를 추가 할 때 업데이트 기능이 있지만 내 데이터는 메모리에 상주 할 정도로 작습니다 (업데이트 할 인스턴스가 많지만). QR 인수 분해 업데이트 (예 : Hammarling 및 Lucas의 "QR 인수 분해 및 …

3
GAM vs GLM을 사용하는 경우
나는 이것이 잠재적으로 광범위한 질문 일 수 있음을 알고 있지만 GLM (Generalized linear model)보다 GAM (Generalized Additive Model)의 사용을 나타내는 일반화 가능한 가정이 있는지 궁금합니다. 누군가 최근에 GAM은 데이터 구조가 "가산 적"이라고 가정 할 때만 사용해야한다고했습니다. 즉, x를 더하면 y를 예측할 수 있습니다. 다른 사람은 GAM이 GLM과 다른 유형의 회귀 …

2
로지스틱 회귀 분석에 대한 신뢰 구간 계산
이항 로지스틱 회귀 분석을 사용 하여 사용자가 무언가를 클릭 할 가능성에 노출 has_x되거나 has_y영향을 미치는지 식별합니다 . 내 모델은 다음과 같습니다. fit = glm(formula = has_clicked ~ has_x + has_y, data=df, family = binomial()) 이것은 내 모델의 출력입니다. Call: glm(formula = has_clicked ~ has_x + has_y, family = binomial(), data …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.