«predictive-models» 태그된 질문

예측 모델은 특정 가설을 테스트하거나 현상을 기계적으로 설명하는 모델과 달리 시스템의 다른 관측을 최적으로 예측하는 것이 주된 목적인 통계 모델입니다. 따라서 예측 모델은 해석 가능성에 중점을 두지 않고 성능에 중점을 둡니다.

1
강력한 방법이 실제로 더 낫습니까?
나는 각각 약 400의 크기와 약 300 개의 예측 변수를 가진 두 그룹의 주제 A와 B를 가지고 있습니다. 내 목표는 이진 반응 변수에 대한 예측 모델을 구축하는 것입니다. 고객은 A에서 B로 작성된 모델을 적용한 결과를보고 싶어합니다. 그의 저서 "Regression Modeling Strategies"에서 @FrankHarrell은 두 개의 데이터 세트를 결합하고 그에 대한 모델을 …

2
이탈 예측을위한 생존 모델-시변 예측 변수?
이탈을 예측하기위한 예측 모델을 구축하고 개인 기간 교육 데이터 세트 (각 고객에 대해 한 행씩, 위험에 처한 개별 기간 및 개별 기간, 이벤트 표시기-1 해당 기간 동안 이탈이 발생한 경우 0). Singer와 Willet 의 기술을 사용하여 일반적인 로지스틱 회귀를 사용하여 모델을 피팅하고 있습니다 . 고객의 이탈은 한 달 동안 어느 …

1
predict.coxph의 출력을 해석하는 방법?
coxmodel을 피팅 한 후에는 예측을 수행하고 새로운 데이터의 상대적 위험을 검색 할 수 있습니다. 내가 이해하지 못하는 것은 개인에 대한 상대 위험을 계산하는 방법과 상대적 (예 : 인구의 평균)은 무엇입니까? 이해하는 데 도움이되는 리소스에 대한 권장 사항 (생존 분석에서 그다지 발전하지 않았으므로 단순할수록 좋습니다)?

4
조지 박스에서 Galit Shmueli와 과학적인 방법은?
(이 질문은 Philosophy SE에 더 적합한 것처럼 보일 수 있습니다. 통계학자가 Box 및 Shmueli의 진술에 대한 나의 오해를 분명히 할 수 있기를 바랍니다. ARIMA 명성의 George Box는 다음과 같이 말했습니다. "모든 모델이 잘못되었지만 일부는 유용합니다." Galit Shmueli는 유명한 논문 인 "설명하거나 예측하기 위해"에서 다음 과 같이 주장한다. 설명과 예측은 동일하지 …

6
가장 빠른 SVM 구현
더 일반적인 질문입니다. 예측 모델링을 위해 rbf SVM을 실행하고 있습니다. 현재 프로그램에 약간의 속도 향상이 필요하다고 생각합니다. 나는 scikit learn을 거친 그리드 검색 + 교차 유효성 검사와 함께 사용합니다. 각 SVM 실행에는 약 1 분이 걸리지 만 모든 반복 작업으로 인해 여전히 너무 느립니다. 결국 여러 코어에서 교차 유효성 검사 …


5
회귀 모형을 개선하기 위해 평균 절대 오차의 상자 그림을 기반으로 특이 치를 제거하는 것이 부정입니까?
아래 상자 그림에서 볼 수 있듯이 네 가지 방법으로 테스트 한 예측 모델이 있습니다. 모델이 예측하는 속성의 범위는 0-8입니다. 당신은이 있음을 알 수 있습니다 하나의 상한선 이상치 와 세 하한 이상치 모든 방법으로 지적했다. 데이터에서 이러한 인스턴스를 제거하는 것이 적절한 지 궁금합니다. 아니면 예측 모델을 개선하기 위해 일종의 부정 행위입니까?

2
Cox 비례 위험 모델로 교차 검증을 수행하는 방법은 무엇입니까?
하나의 데이터 세트 (모델 구축 데이터 세트)에서 특정 질병의 발생에 대한 예측 모델을 구성했으며 이제 새 데이터 세트 (유효성 검증 데이터 세트)에서 모델이 얼마나 잘 작동하는지 확인하려고합니다. 로지스틱 회귀로 작성된 모델의 경우 모델 빌딩 데이터 세트에서 얻은 모델 계수를 기반으로 유효성 검사 데이터 세트의 각 사람에 대한 예측 확률을 계산 …

1
설명 적 모델링에서 편견을 최소화하는 이유는 무엇입니까? (Galit Shmueli의“설명 또는 예측”)
이 질문은 Galit Shmueli의 논문 "설명 또는 예측"을 참조 합니다. 구체적으로 1.5 절, "설명과 예측이 다르다"에서 Shmueli 교수는 다음과 같이 썼다. 설명 모델링에서 초점은 기본 이론의 가장 정확한 표현을 얻기 위해 편향을 최소화하는 데 있습니다. 내가 신문을 읽을 때마다 당황했습니다. 추정의 편향을 최소화하는 것은 어떤 의미에서 기본 이론을 가장 정확하게 …

2
시계열에 대한이 예측이 왜“꽤 열악”합니까?
신경망 사용법을 배우려고합니다. 이 튜토리얼 을 읽고있었습니다 . 의 값을 사용하여 t + 1 의 값을 예측 하여 시계열에 신경망을 피팅 한 후 저자는 다음 그림을 얻습니다. 여기서 파란색 선은 시계열, 녹색은 열차 데이터에 대한 예측, 빨간색은 테스트 데이터 예측 (테스트 기차 분할 사용)티티tt + 1티+1t+1 "모델이 훈련 데이터 세트와 …

4
예측 모델 : 통계는 머신 러닝을 능가 할 수 있습니까? [닫은]
폐쇄되었습니다 . 이 질문은 더 집중되어야 합니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 한 가지 문제에만 집중할 수 있도록 질문을 업데이트하십시오 . 휴일 2 년 전 . 현재 통계 / 경제학에 중점을 둔 마스터 프로그램을 따르고 있습니다. 제 주인은 모든 학생들이 3 개월 동안 …

4
랜덤 포레스트 방법론을 선형 회귀에 적용 할 수 있습니까?
랜덤 포레스트는 원래 훈련 데이터의 부트 스트랩 샘플 (입력 변수와 관측 값의 샘플)을 사용하여 각 트리가 생성되는 의사 결정 트리의 앙상블을 만들어 작동합니다. 선형 회귀 분석에 유사한 프로세스를 적용 할 수 있습니까? 각 k 회귀에 대해 랜덤 부트 스트랩 샘플을 사용하여 k 선형 회귀 모델 생성 모형과 같은 "무작위 회귀"를 …

2
Quantile 모델링의 모델 성능
나는 중간 회귀에 중점을 두지 않고 대신 높은 양자 (예 : 75 번째) 를 통해 Quantile Regression (예 : via gbm또는 quantregR)을 사용하고 있습니다. 예측 모델링 배경에서 모델이 테스트 세트에 얼마나 적합한 지 측정하고이를 비즈니스 사용자에게 설명 할 수 있기를 원합니다. 내 질문은 어떻게? 연속 대상이있는 일반적인 설정에서 다음을 수행 …

1
예측 성능은 방법보다는 데이터 분석가의 전문 지식에 더 의존합니까?
나는 일부 연구에서 예측 모델의 성능이 분석법의 선택보다는 선택된 분석법에 대한 데이터 분석가의 전문 지식에 더 의존한다는 소문을 발견했습니다. 다시 말해, 주장은 데이터 분석가가보다 이론적 인 관점에서 본 방법이 문제에 대해 "적절한"것으로 보이는 것보다 선택된 방법에 익숙한 것이 더 중요하다는 주장이다. 이것은 일반적으로 많은 변이체 (100-1000), 다중 공선 성 및 …

1
캐럿 glmnet vs cv.glmnet
glmnetwithin caret을 사용하여 최적의 람다를 검색 cv.glmnet하고 동일한 작업을 수행하는 것을 비교하는 데 많은 혼란이있는 것 같습니다 . 다음과 같은 많은 질문이 제기되었습니다. 분류 모델 train.glmnet 대 cv.glmnet? 캐럿과 함께 glmnet을 사용하는 올바른 방법은 무엇입니까? `caret`를 사용한 교차 유효성 검사`glmnet` 그러나 질문의 ​​재현 가능성으로 인한 답변이 없습니다. 첫 번째 질문에 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.