«predictive-models» 태그된 질문

예측 모델은 특정 가설을 테스트하거나 현상을 기계적으로 설명하는 모델과 달리 시스템의 다른 관측을 최적으로 예측하는 것이 주된 목적인 통계 모델입니다. 따라서 예측 모델은 해석 가능성에 중점을 두지 않고 성능에 중점을 둡니다.

1
네이트 실버가 황토에 대해 말한 것에 대한 설명
A의 나는 최근 묻는 질문 , 나는 "아니오 - 아니오"황토로 추정 할 수있는 큰 것을 들었다. 그러나 Nate Silver의 FiveThirtyEight.com에 관한 최신 기사에서 그는 선거 예측을 위해 황토를 사용하는 것에 대해 논의했습니다. 그는 황토로 공격적 예측과 보수적 예측의 세부 사항을 논의하고 있었지만, 황토 로 미래 예측을하는 것이 타당하다고 생각합니까? 나는 …

2
Scikit-learn의 평균 절대 백분율 오차 (MAPE) [닫기]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 2 년 전 . Python과 scikit-learn을 사용하여 예측의 평균 절대 백분율 오차 (MAPE)를 어떻게 계산할 수 있습니까? 에서 워드 프로세서 , 우리는 회귀 만이 4 개 미터 …

3
모형의 예측 확률에 대한 보정 시각화
각 인스턴스에 대해 각 클래스에 대한 확률을 생성하는 예측 모델이 있다고 가정합니다. 이제 이러한 확률을 분류 (정밀도, 리콜 등)에 사용하려는 경우 이러한 모델을 평가할 수있는 여러 가지 방법이 있음을 알고 있습니다. 또한 ROC 곡선과 그 아래의 영역을 사용하여 모델이 클래스를 얼마나 잘 구별하는지 확인할 수 있습니다. 그것들은 내가 요구하는 것이 …

3
예측 모델링 경쟁 사이트
저는 Kaggle , TunedIt 및 CrowdAnalytix의 예측 모델링 경쟁에 참여 하고 있습니다 . 이 사이트는 통계 / 기계 학습을위한 "운동"하는 좋은 방법이라는 것을 알았습니다. 알아야 할 다른 사이트가 있습니까? 주최자가 경쟁 업체의 제출물로 이익을 얻으려는 경쟁에 대해 어떻게 생각하십니까? / edit : 여기에 더 완전한 목록이 있습니다 : Kaggle TunedIt …


3
양성 사례 만 훈련으로하여 결과를 예측하는 방법은 무엇입니까?
간단하게하기 위해 스팸 / 스팸이 아닌 전자 메일의 고전적인 예를 작업하고 있다고 가정하겠습니다. 20000 개의 이메일이 있습니다. 이 중 2000은 스팸이라는 것을 알고 있지만 스팸이 아닌 전자 메일의 예는 없습니다. 나머지 18000이 스팸인지 아닌지를 예측하고 싶습니다. 이상적으로, 내가 찾은 결과는 전자 메일이 스팸 일 확률 (또는 p- 값)입니다. 이 상황에서 …

2
일반 데이터 세트를위한 데이터 확대 기술?
많은 기계 학습 응용 프로그램에서 소위 데이터 보강 방법을 사용하면 더 나은 모델을 만들 수 있습니다. 예를 들어, 고양이와 강아지 의 이미지 훈련 세트를 가정하십시오 . 회전, 미러링, 대비 조정 등을 통해 원래 이미지에서 추가 이미지를 생성 할 수 있습니다.100100100 이미지의 경우, 데이터 확대는 비교적 간단합니다. 그러나 예를 들어 샘플로 …

2
StackExchange 질문에 대한 "흥미"기능
이 질문은 교차 검증에서 답변 될 수 있기 때문에 Mathematics Stack Exchange에서 마이그레이션 되었습니다. 8 년 전에 이주했습니다 . StackExchange 사이트를위한 데이터 마이닝 패키지를 만들려고하는데 특히 "가장 흥미로운"질문을 찾기 위해 노력하고 있습니다. 질문 점수를 사용하고 싶지만 조회수로 인한 편견을 제거하고 있지만 엄격하게 접근하는 방법을 모르겠습니다. 이상적인 세계에서는 을 계산하여 질문을 …

2
과적 합에 대한 베이지안 생각
전통적인 잦은 통계 영역에서 예측 모델을 검증하기위한 방법 및 소프트웨어 개발에 많은 시간을 투자했습니다 . 더 많은 베이지안 아이디어를 실천하고 가르치면서 나는 수용해야 할 몇 가지 중요한 차이점을 봅니다. 먼저, 베이지안 예측 모델링은 분석가에게 후보 기능에 맞게 사용자 정의 할 수있는 이전 분포에 대해 열심히 생각하도록 요구하며, 이러한 사전은 모델을 …

2
강화 : 왜 학습률이 정규화 매개 변수라고 불리는가?
그라디언트 부스팅 의 학습 속도 매개 변수 ( )는 시리즈에 추가 된 각각의 새 기본 모델 (일반적으로 얕은 나무)의 기여도를 줄입니다. 테스트 세트 정확도를 크게 향상시키는 것으로 나타 났으며, 이는 작은 단계에서와 같이 이해할 수있는 최소 손실 기능을보다 정확하게 얻을 수 있습니다. ν∈ [ 0 , 1 ]ν∈[0,1]\nu \in [0,1] …

1
예측 모델링-혼합 모델링에 관심을 가져야합니까?
예측 모델링의 경우 무작위 효과 및 비 독립적 관측치 (반복 측정)와 같은 통계 개념에 관심을 가져야합니까? 예를 들어 ... 다양한 속성과 구매 플래그가있는 5 개의 DM 캠페인 (1 년 동안 발생) 데이터가 있습니다. 이상적으로는이 모든 데이터를 결합하여 캠페인 당시 고객 속성이 지정된 구매 모델을 구축하는 것이 이상적입니다. 구매 이벤트가 드물기 …

2
이전 이벤트 시간을 기준으로 다음 이벤트 발생시기를 예측하는 방법은 무엇입니까?
저는 고등학생이며 컴퓨터 프로그래밍 프로젝트를 진행하고 있지만 고등학교 통계 과정을 넘어서는 통계 및 모델링 데이터에 대한 경험이 많지 않아 혼란 스럽습니다. 기본적으로 누군가가 문서를 인쇄하기로 결정한 시간의 합리적으로 큰 목록 (통계 테스트 또는 측정에 대한 가정을 충족하기에 충분히 크다고 가정)을 가지고 있습니다. 이 목록을 바탕으로 이전 이벤트 시간을 모두 고려하여 …

4
선형, 지수 및 로그 함수에서 최적 피팅 곡선 피팅 함수 결정
문맥: Mathematics Stack Exchange (프로그램을 작성할 수 있습니까?) 에 대한 질문에서 누군가 점 세트 를 가지고 있으며 선형, 지수 또는 로그에 곡선을 맞추고 싶습니다. 일반적인 방법은 다음 중 하나를 선택하여 시작하고 (모델 지정) 통계 계산을 수행하는 것입니다.x - y엑스−와이x-y 그러나 실제로 원하는 것은 선형, 지수 또는 대수에서 '최상의'곡선을 찾는 것입니다. …

3
선형 모형에서 예측 한계에 대한 공식 얻기 (예 : 예측 간격)
다음 예제를 보자. set.seed(342) x1 <- runif(100) x2 <- runif(100) y <- x1+x2 + 2*x1*x2 + rnorm(100) fit <- lm(y~x1*x2) 이것은 OLS 회귀를 사용하여 x1 및 x2를 기준으로 y의 모형을 만듭니다. 주어진 x_vec에 대해 y를 예측하려면 간단히에서 얻은 공식을 사용할 수 있습니다 summary(fit). 그러나 y의 하한 예측과 상한 예측을 예측하려면 …

1
Stepwise AIC-이 주제와 관련하여 논란이 있습니까?
이 사이트에서 p- 값 기반, AIC, BIC 등 모든 종류의 기준을 사용하여 단계별로 변수를 선택하는 것에 대해 믿을 수 없을 정도로 많은 게시물을 읽었습니다. 이러한 절차가 일반적으로 변수 선택에있어 왜 좋지 않은지 이해합니다. 궁의 아마 유명한 포스트는 여기에 명확하게 이유를 설명; 궁극적으로 우리는 단지 데이터 준설이라는 가설을 제시 할 때 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.