«regression-strategies» 태그된 질문

회귀 모델링 전략


7
연속 예측 변수를 분해하면 어떤 이점이 있습니까?
모델에서 값을 사용하기 전에 연속 예측 변수를 가져 와서 분해 (예 : 5 분위수)하는 데 어떤 가치가 있는지 궁금합니다. 변수를 비닝하면 정보가 손실되는 것 같습니다. 이것이 비선형 효과를 모델링 할 수 있도록하는 것입니까? 변수를 연속적으로 유지하고 실제로 직선 관계가 아닌 경우 데이터에 가장 잘 맞는 커브를 만들어야합니까?



1
모형에서 항을 제거한 후 적절한 잔차 자유도
저는 이 질문 에 대한 토론 과 특히 축소 된 모형 (예 : 여러 설명 변수가 테스트되고 거부 된 모형)의 분산 추정치는 Ye의 일반화 된 자유도를 사용해야한다는 Frank Harrell의 의견을 반영하고 있습니다 . Harrell 교수는 이것이 최종 모델 (여러 변수가 기각 된)의 모델보다 원래의 "풀"모델 (모든 변수가 포함 된)의 잔류 …

3
Hosmer-Lemeshow 적합도의 로지스틱 회귀 및 해석 평가
우리 모두 알고 있듯이 로지스틱 회귀 모델을 평가하는 두 가지 방법이 있으며 매우 다른 것들을 테스트하고 있습니다. 예측력 : 독립 변수를 기반으로 종속 변수를 얼마나 잘 예측할 수 있는지 측정하는 통계량을 얻으십시오. 잘 알려진 Pseudo R ^ 2는 McFadden (1974)과 Cox and Snell (1989)입니다. 적합도 통계 이 테스트는 모델을 더 …

2
최종 데이터 (생산 준비) 모델을 완전한 데이터 또는 훈련 세트에 대해서만 훈련해야합니까?
훈련 세트에 대해 여러 모델을 훈련시키고 교차 검증 세트를 사용하여 최상의 모델을 선택하고 테스트 세트에서 성능을 측정했다고 가정합니다. 이제 최종 최고의 모델이 하나 있습니다. 사용 가능한 모든 데이터 또는 훈련 세트에 대해서만 훈련 된 선박 솔루션에 대해 교육해야합니까? 후자의 경우 왜? 업데이트 : @ P.Windridge가 지적했듯이 재교육 모델을 배송하는 것은 …

5
Quantile 회귀는 언제 OLS보다 나쁩니 까?
조건부 평균 관계를 절대적으로 이해해야하는 고유 한 상황 외에도 연구원이 Quantile Regression보다 OLS를 선택해야하는 상황은 무엇입니까? 나는 중간 회귀를 OLS 대체물로 사용할 수 있기 때문에 "꼬리 관계를 이해하는 데 쓸모가 없다면"이라는 대답을 원하지 않습니다.

2
과적 합에 대한 베이지안 생각
전통적인 잦은 통계 영역에서 예측 모델을 검증하기위한 방법 및 소프트웨어 개발에 많은 시간을 투자했습니다 . 더 많은 베이지안 아이디어를 실천하고 가르치면서 나는 수용해야 할 몇 가지 중요한 차이점을 봅니다. 먼저, 베이지안 예측 모델링은 분석가에게 후보 기능에 맞게 사용자 정의 할 수있는 이전 분포에 대해 열심히 생각하도록 요구하며, 이러한 사전은 모델을 …

2
LASSO는 단계적 회귀와 같은 문제로 고통 받습니까?
단계적 알고리즘 변수 선택 방법은 회귀 모델 ( ββ\beta 및 SE, p- 값 , F 통계 등)의 모든 추정치에 다소 차이가있는 모형에 대해 선택하는 경향이 있으며 다음과 같이 실제 예측 변수를 배제 할 가능성이 높습니다. 합리적으로 성숙한 시뮬레이션 문헌에 따른 거짓 예측 자. 변수를 선택하는 데 LASSO가 동일한 특정 방식으로 …

1
표본 크기를 임의 변수로 만드는 것은 무엇을 의미합니까?
Frank Harrell 님이 블로그 ( Statistical Thinking)를 시작했습니다 . 그의에서 최고의 후 , 그는 자신의 통계 철학의 몇 가지 주요 기능을 나열합니다. 다른 항목들에는 다음이 포함됩니다. 가능하면 표본 크기를 임의 변수로 설정 "샘플 크기를 임의의 변수로 만든다"는 것은 무엇을 의미합니까? 이 작업의 장점은 무엇입니까? 왜 바람직할까요?

3
Hosmer et al.을 이용한 모델 구축 및 선택 2013. R의 로지스틱 회귀 적용
이것은 StackExchange에 대한 첫 번째 게시물이지만 꽤 오랫동안 리소스로 사용 해 왔으며 적절한 형식을 사용하고 적절한 편집을 위해 최선을 다할 것입니다. 또한 이것은 여러 부분으로 구성된 질문입니다. 질문을 여러 개의 다른 게시물 또는 하나의 게시물로 나눌 것인지 확실하지 않았습니다. 질문은 모두 같은 텍스트에서 한 섹션에 있기 때문에 하나의 질문으로 게시하는 …

5
선형 모형에서 중요하지 않은 수준의 요인에 대한 계수를 무시할 수 있습니까?
여기서 선형 모델 계수에 대한 설명을 찾은 후 요인 수준 계수에 대한 비의 미적 (높은 p 값)에 대한 후속 질문이 있습니다. 예 : 선형 모델에 10 개의 수준이있는 요인이 포함되어 있고 해당 수준 중 3 개만 관련 p 값이있는 경우 모형을 사용하여 Y를 예측할 때 대상이 다음 중 하나에 해당하는 …

4
어떤 변수가 어떤 PCA 구성 요소를 설명합니까?
이 데이터를 사용하여 : head(USArrests) nrow(USArrests) 다음과 같이 PCA를 수행 할 수 있습니다. plot(USArrests) otherPCA <- princomp(USArrests) 나는 새로운 구성 요소를 얻을 수 있습니다 otherPCA$scores 구성 요소가 설명하는 분산 비율 summary(otherPCA) 그러나 어떤 변수가 주로 어떤 주성분으로 설명되는지 알고 싶다면 어떻게해야합니까? 그리고 그 반대의 경우도 마찬가지입니다 : 예를 들어 PC1 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.