통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

5
회귀에 지연 종속 변수 포함
지연된 종속 변수를 회귀 모델에 포함시키는 것이 합법적인지에 대해 매우 혼란스러워합니다. 기본적 으로이 모델이 Y와 다른 독립 변수의 변화 사이의 관계에 초점을 맞춘다면 오른쪽에 지연 종속 변수를 추가하면 다른 IV 이전의 계수가 Y의 이전 값과 독립적임을 보장 할 수 있습니다. 일부는 LDV의 포함이 다른 IV의 계수를 하향 편향시킬 것이라고 말한다. …

4
이항, 음성 이항 및 포아송 회귀의 차이점
이항, 음 이항 및 포아송 회귀의 차이점과 이러한 회귀가 가장 적합한 상황에 대한 정보를 찾고 있습니다. SPSS에서 수행 할 수있는 테스트 중 어떤 상황이 내 상황에 가장 적합한 지 알려주는 테스트가 있습니까? 또한 회귀 부분에서 볼 수있는 것과 같은 옵션이 없으므로 SPSS에서 포아송 또는 음 이항을 어떻게 실행합니까? 유용한 링크가 …

2
lmer에서 모델을 올바르게 지정 했습니까?
많은 도움말 사이트를 and이 뒤져서 혼합 모델에서 더 복잡한 중첩 용어를 지정하는 방법에 대해 여전히 혼란 스럽습니다. 또한의 사용으로 혼란 스러워요 :과 /와 |상호 작용을 지정하고 사용하여 임의 요소와 중첩에 lmer()에서 lme4의 패키지 R. 이 질문의 목적을 위해이 표준 통계 모델로 내 데이터를 정확하게 묘사했다고 가정합니다. 고정되고, 및 무작위입니다. 안에 …

4
내부 대 외부 교차 검증 및 모델 선택
교차 검증 및 모델 선택을 통해 다음 두 가지 사항을 해결하려고합니다. P1 . 표본으로 훈련 할 때 모집단에 대한 예상 손실 추정 P2 . 이 추정의 불확실성 (분산, 신뢰 구간, 편향 등)을 측정하고보고하십시오. 표준 관행은 교차 추정을 반복하는 것으로 보입니다. 이는 추정기의 분산을 감소시키기 때문입니다. 그러나보고 및 분석과 관련하여 내부 …

3
AIC 모델 비교를위한 전제 조건
AIC 모델 비교가 작동하려면 정확히 필요한 전제 조건은 무엇입니까? 다음과 같이 비교했을 때이 질문을 방금했습니다. > uu0 = lm(log(usili) ~ rok) > uu1 = lm(usili ~ rok) > AIC(uu0) [1] 3192.14 > AIC(uu1) [1] 14277.29 이 방법 log으로 variable 의 변환을 정당화했습니다 usili. 그러나 종속 변수가 다른 경우 모델을 AIC …

2
캐럿에서 cv와 repeatcv의 실제 차이점은 무엇입니까?
이것은 질문 캐럿 리샘플링 방법 과 유사 하지만, 실제로이 부분에 대해서는 합의 된 방식으로 답변 한 적이 없습니다. 캐럿의 열차 기능 제공 cv및 repeatedcv. 말하는 것과의 차이점은 무엇입니까? MyTrainControl=trainControl( method = "cv", number=5, repeats=5 ) vs MyTrainControl=trainControl( method = "repeatedcv", number=5, repeats=5 ) cv세트를 k- 폴드 (parameter number) 로 나누고 …

4
연속 및 범주 기능을 모두 사용하여 예측
일부 예측 모델링 기법은 연속 예측 변수를 처리하기 위해 더 설계된 반면, 다른 예측 기법은 범주 형 또는 이산 변수를 처리하는 데 더 좋습니다. 물론 한 유형을 다른 유형으로 변환하는 기술이 있습니다 (분산, 더미 변수 등). 그러나 단순히 피처 유형을 변환하지 않고 두 유형의 입력을 동시에 처리하도록 설계된 예측 모델링 …

1
PCA, LDA, CCA 및 PLS
PCA, LDA, CCA 및 PLS는 어떤 관련이 있습니까? 그것들은 모두 "스펙트럼"과 선형 대수적이며 매우 잘 이해되어 있습니다 (예를 들어 50 년 이상의 이론이 세워져 있습니다). 그것들은 매우 다른 것들 (차원 축소를위한 PCA, 분류를위한 LDA, 회귀를위한 PLS)에 사용되지만 여전히 매우 밀접하게 관련되어 있다고 느낍니다.

1
가우스 모형에서 최소 제곱과 MLE의 동등성
저는 머신 러닝을 처음 사용하며 스스로 배우려고합니다. 최근에 저는 강의 노트를 읽고 기본적인 질문을했습니다. 슬라이드 13은 "최소 제곱 추정값은 가우스 모형의 최대 우도 추정값과 동일합니다"라고 말합니다. 단순한 것 같지만 이것을 볼 수 없습니다. 누군가 여기서 무슨 일이 일어나고 있는지 설명해 주시겠습니까? 나는 수학을보고 싶다. 나중에 Ridge와 Lasso 회귀에 대한 확률 …


6
여러 시계열에서 동일한 모델 추정
나는 시계열의 초보자 배경 (일부 ARIMA 추정 / 예측)을 가지고 있으며 완전히 이해하지 못하는 문제에 직면하고 있습니다. 도움을 주시면 감사하겠습니다. 나는 동일한 유형의 데이터를 설명하는 동일한 시간 간격과 동일한 빈도로 여러 시계열을 분석하고 있습니다. 각 계열은 하나의 변수이므로 내가보고있는 다른 해당 예측 변수가 없습니다. 모든 시리즈를 설명하는 단일 모델을 추정하라는 …


2
벡터 머신 및 회귀 지원
서포트 벡터 머신이 분류를 처리하는 방법에 대해서는 이미 훌륭한 논의 가 있었지만 서포트 벡터 머신이 회귀로 일반화되는 방법에 대해서는 매우 혼란스러워합니다. 누구든지 나를 밝히고 싶어?


1
SARIMAX를 직관적으로 이해하는 방법?
전기 부하 예측에 대한 논문을 이해하려고하지만 내부 개념, 특히 SARIMAX 모델 과 관련하여 어려움을 겪고 있습니다. 이 모델은 부하를 예측하는 데 사용되며 이해하지 못하는 많은 통계 개념을 사용합니다 (저학년 컴퓨터 과학 학생입니다-통계에서 평신도라고 생각할 수 있습니다). 그것이 어떻게 작동하는지 완전히 이해할 필요는 없지만 적어도 일어나고있는 일을 직관적으로 이해하고 싶습니다. 나는 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.