«modeling» 태그된 질문

이 태그는 통계 또는 기계 학습 모델을 만드는 프로세스를 설명합니다. 항상 더 구체적인 태그를 추가하십시오.

2
두 개의 선형 회귀 모델이 주어지면 어떤 모델이 더 잘 수행됩니까?
대학에서 기계 학습 과정을 수강했습니다. 퀴즈 중 하나 에서이 질문을 받았습니다. 모델 1 : y=θx+ϵy=θx+ϵ y = \theta x + \epsilon 모델 2 : y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x + \theta^2 x + \epsilon 위의 모델 중 어느 것이 데이터에 더 적합합니까? (선형 회귀를 사용하여 데이터를 모델링 할 수 있다고 …

3
고정 / 무작위 효과 모델의 개념
고정 / 무작위 효과 모델을 이해하도록 도와 줄 수 있습니까? 이러한 개념을 요약 한 경우 나만의 방식으로 설명하거나 특정 주소 (페이지 번호, 챕터 등)가있는 리소스 (도서, 메모, 웹 사이트)로 안내하여 혼동없이 배울 수 있습니다. "일반적으로 고정 된 효과가 있고 임의의 효과는 특정한 경우"입니까? 설명이 일반 모델에서 고정 및 임의 효과가있는 …

1
회귀 분석의 비율, 즉 Kronmal에 대한 질문
최근 무작위로 탐색하는 질문으로 인해 몇 년 전에 회귀 모형의 비율 사용에 대해 경고하면서 교수 중 한 명이 직접 의견을 떠올리게되었습니다. 그래서 나는 이것에 대해 읽기 시작하여 결국 Kronmal 1993로 이어졌습니다. 나는 이것을 모델링하는 방법에 대한 그의 제안을 올바르게 해석하고 있는지 확인하고 싶습니다. : 종속 독립 측에서도 같은 분모 비율로 …

2
인구 밀도 추정 모델
(인구, 면적, 모양) 데이터베이스는 인구 / 지역의 상수 값을 각 모양 (Census block, tract, county, state 등과 같은 다각형)에 할당하여 인구 밀도를 매핑하는 데 사용할 수 있습니다. 그러나 인구는 일반적으로 다각형 내에 균일하게 분포되지 않습니다. Dasymetric mapping 은 보조 데이터를 사용하여 이러한 밀도 추정값을 조정하는 프로세스입니다. 이 최근 검토에서 알 …

2
일반 영어로 모델 조정 설명
통계학 분석의 방법과 결과, 특히 역학에서 결과를 읽음으로써 나는 종종 모델의 조정 또는 제어 에 대해 듣습니다 . 비 통계 학자에게 그 목적을 어떻게 설명 하시겠습니까? 특정 변수를 제어 한 후 결과를 어떻게 해석합니까? Stata 또는 R의 작은 연습 또는 온라인에 대한 포인터는 진정한 보석입니다.

3
로지스틱 회귀 분석에서 WoE (증거의 무게)로 변수 바꾸기
이것은 내 동료들과 함께 연습이나 방법에 관한 질문입니다. 로지스틱 회귀 모델을 만드는 동안 사람들이 범주 형 변수 (또는 비닝되는 연속 형 변수)를 각각의 증거 가중치 (WoE)로 대체하는 것을 보았습니다. 이것은 회귀 변수와 종속 변수 사이의 단조로운 관계 를 설정하기 위해 수행됩니다 . 내가 이해하는 한 모델이 만들어지면 방정식의 변수는 데이터 …

2
예측이 통계량의 능력을 판단하는 '골든 기준'입니까?
지난 주말에 R (1st edition)로 Faraway의 교과서 선형 모델을 읽었습니다 . Faraway에는 "통계 전략 및 모델 불확실성"이라는 장이있었습니다. 그는 매우 복잡한 모델을 사용하여 인위적으로 일부 데이터를 생성했다고 설명하고 (158 페이지), 학생들에게 데이터를 모델링하고 학생들의 예측 결과 와 읽은 결과를 비교하도록 요청했습니다 . 불행히도 대부분의 학생들은 테스트 데이터를 과도하게 맞추고 예측 …

1
변수 대 잠재 변수
나는 이것에 대해 전에 물었고 모델 매개 변수를 만드는 것과 잠복 변수를 만드는 것을 식별하는 데 어려움을 겪었습니다. 따라서이 사이트 에서이 주제에 대한 다양한 스레드를 살펴보면 주요 차이점은 다음과 같습니다. 잠복 변수는 관찰되지 않지만 변수 및 매개 변수도 관찰되지 않으며 변수와 관련이 없으므로 분포가 없습니다. 이는 상수이며 고정하지만 알 수없는 …

1
가산 오차 또는 곱셈 오차?
통계에 익숙하지 않아서 이해하는 데 도움이 될 것입니다. 내 분야에는 일반적으로 사용되는 형식의 모델이 있습니다. Pt=Po(Vt)αPt=Po(Vt)αP_t = P_o(V_t)^\alpha 사람들이 모델을 데이터에 맞추면 일반적으로 모델을 선형화하고 다음에 적합합니다. log(Pt)=log(Po)+αlog(Vt)+ϵlog⁡(Pt)=log⁡(Po)+αlog⁡(Vt)+ϵ\log(P_t) = \log(P_o) + \alpha \log(V_t) + \epsilon 이거 괜찮아? 신호의 노이즈로 인해 실제 모델은 Pt=Po(Vt)α+ϵPt=Po(Vt)α+ϵP_t = P_o(V_t)^\alpha + \epsilon 위와 같이 선형화 …


1
비율 분석 기법
비율과 비율 분석을 다루는 조언과 의견을 찾고 있습니다. 내가 비율을 분석하는 분야에서 특히 널리 퍼져 있지만 문제가 될 수 있다고 제안하는 몇 가지 논문을 읽었습니다. Kronmal, Richard A. 1993. 스퓨리어스 상관 관계와 비율 표준의 오류가 재검토되었습니다. 왕립 통계 학회지 시리즈 A 156 (3) : 379-392 및 관련 논문. 내가 지금까지 …

2
구조 방정식 모델에서 매우 작은 샘플을 갖는 복잡한 문제
저는 Amos 18에서 구조 방정식 모델 (SEM)을 운영하고 있습니다. 나는 느슨하게 사용 된 실험에 100 명의 참가자를 찾고 있었는데 이는 아마도 성공적인 SEM을 수행하기에 충분하지 않은 것으로 간주됩니다. SEM (EFA, CFA와 함께)이 "큰 표본"통계 절차라고 반복해서 들었습니다. 간단히 말해서, 나는 100 명의 참가자에게 그것을 만들지 않았으며 (놀랍습니다!) 두 개의 문제가있는 …

1
올가미에 대한 LARS 대 좌표 하강
L1 정규 선형 회귀 피팅에 LARS [1] 사용과 좌표 하강 사용의 장단점은 무엇입니까? 나는 주로 퍼포먼스 측면에 관심이있다 (내 문제는 N수십만에서 p20 이하인 경향이있다 ). 그러나 다른 통찰력도 인정 될 것이다. 편집 : 내가 질문을 게시 한 후 chl은 Friedman 등의 논문 [2]에 좌표 하강이 다른 방법보다 상당히 빠른 것으로 …

5
예측을 위해 여러 모델을 사용해야하는 경우
이것은 상당히 일반적인 질문입니다. 나는 일반적으로 여러 다른 모델을 사용하면 샘플에서 시계열을 예측하려고 할 때 하나의 모델보다 뛰어납니다. 모델 조합이 단일 모델보다 성능이 뛰어남을 보여주는 좋은 논문이 있습니까? 여러 모델을 결합하는 모범 사례가 있습니까? 일부 참고 문헌 : Hui Zoua, Yuhong Yang "예측을위한 시계열 모델 결합" International Journal of Forecasting …

1
GBM 패키지와 GBM을 사용하는 Caret
을 사용하여 모델 튜닝을 수행 caret했지만 gbm패키지를 사용하여 모델을 다시 실행했습니다 . caret패키지가 사용 gbm하고 출력이 동일해야한다는 것을 이해합니다 . 그러나 data(iris)RMSE와 R ^ 2를 평가 지표로 사용하면 약 5 %의 모델에서 불일치가 발생합니다. 부분 종속성 플롯을 사용 하기 위해 최적의 모델 성능을 찾고 caret싶지만 다시 실행 하고 싶습니다 gbm. …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.