계절이 많은 제품에 대한 일일 판매 데이터가 있습니다. 회귀 모형의 계절성을 캡처하고 싶습니다. 분기 별 또는 월별 데이터가있는 경우 각각 3 개 및 11 개의 더미 변수를 만들 수 있지만 일일 데이터를 처리 할 수 있습니까? 3 년 간의 일일 데이터가 있습니다. 독립 변수는 가격, 판촉 플래그 (예 / 아니오) …
능선, 올가미 및 탄성 그물로 선택한 모델을 비교하고 싶습니다. 아래 그림은 릿지 (그림 A, 알파 = 0), 올가미 (그림 B; 알파 = 1) 및 탄성 그물 (그림 C; 알파 = 0.5)의 세 가지 방법을 모두 사용하여 계수 경로를 보여줍니다. 최적의 솔루션은 선택된 람다 값에 따라 달라지며, 이는 교차 검증을 기반으로 …
다중 회귀 분석의 자유도는 과 같습니다. 여기서 k 는 변수의 개수입니다.N−k−1N−k−1N-k-1kkk 합니까 (즉, 응답 변수를 포함 Y를 )? 예를 들어, Y = B 0 + B 1 X 1 + B 2 X 2 모델 에서 k = 3 입니까 (즉, Y , X 1 , & X 2에 대해 …
이것이 새로운 질문이라면 죄송합니다. 통계를 처음으로 가르치려고합니다. 기본 절차가 중단되었다고 생각하지만 R로 실행하는 데 어려움을 겪고 있습니다. 그래서 저는 선형 선형 회귀 형태의 회귀 계수의 중요성을 평가하려고합니다. 와이^= Xβ^와이^=엑스β^ \hat y = X \hat \beta 테스트를위한 t- 통계량 은 다음과 같이 주어집니다.H0: β^제이= 0 , Hㅏ: β^제이≠ 0H0:β^제이=0,Hㅏ:β^제이≠0H_0: \hat \beta_j …
한 연구원이 데이터 세트를 탐색하고 1000 개의 서로 다른 회귀 분석을 실행한다고하는데 그 중 하나의 흥미로운 관계를 발견했다고 상상해보십시오. 이제 같은 데이터를 가진 다른 연구원 이 단 한 번의 회귀 만 실행 한다고 상상해보십시오 . 다른 연구원이 1000 번의 회귀를 찾은 것과 같은 결과 인 것으로 나타났습니다. 연구원 2는 연구원 …
일 변량의 점 집합의 직교 다항식은 내적과 쌍별 상관이 0 인 방식으로 해당 점에 값을 생성하는 다항식입니다. R은 함수 poly로 직교 다항식을 생성 할 수 있습니다 . 동일한 함수에는 다변량 점 세트에서 직교 다항식을 생성하는 변형 폴리 옴이 있습니다. 어쨌든 결과 다항식은 쌍으로 0의 상관 관계가 있다는 점에서 직교하지 않습니다. …
Wikipedia 에서 공식을 보았습니다 . Mahalanobis 거리 및 레버리지와 관련이 있습니다. Mahalanobis 거리는 지렛대 통계량 hhh 와 밀접한 관련이 있지만, 다른 척도를 갖습니다. D2=(N−1)(h−1N).D2=(N−1)(h−1N).D^2 = (N - 1)(h - \tfrac{1}{N}). A의 링크 된 기사 , 위키 백과 설명 hhh 이 용어를 : 선형 회귀 모델에서는 대한 활용 점수 나는t의 시간ithi^{th} …
미국의 와인 판매에 대한 대규모 집계 시장 데이터가 있으며 특정 고품질 와인에 대한 수요를 추정하고 싶습니다. 이러한 시장 점유율은 기본적으로 형태의 임의의 유틸리티 모델에서 파생 된이 여기서 X 관찰 포함 제품 특성, p는 제품 가격을 나타내고, ξUijt=X′jtβ−αpjt+ξjt+ϵijt≡δjt+ϵjtUijt=Xjt′β−αpjt+ξjt+ϵijt≡δjt+ϵjtU_{ijt} = X’_{jt}\beta - \alpha p_{jt} + \xi_{jt} + \epsilon_{ijt} \equiv \delta_{jt} + \epsilon_{jt}XXXpppξξ\xi영향을 …
자연적인 (즉, 제한된) 큐빅 스플라인을 사용할 때 생성 된 기본 함수는 매우 공 선형이며 회귀에 사용될 때 다중 공선 성을 나타내는 매우 높은 VIF (분산 인플레이션 계수) 통계를 생성하는 것으로 보입니다. 예측 목적으로 모델의 경우를 고려할 때 이것이 문제입니까? 스플라인 구조의 특성으로 인해 항상 그렇습니다. 다음은 R의 예입니다. library(caret) library(Hmisc) …
회귀 분석과 반응 ( +0,43) 사이에 양의 상관 관계를 얻을 수 있으며, 그 후에이 회귀 분석기의 적합 회귀 모형에서 음의 계수를 얻을 수 있습니까? 일부 모델에서 회귀 기호의 변화에 대해 이야기하고 있지 않습니다. 계수 부호는 항상 유지됩니다. 적합 모형의 나머지 변수가 부호 변경에 영향을 줄 수 있습니까?
참고 :이 질문은 법적 이유로 인해 이전 질문을 삭제해야했기 때문에 다시 게시되었습니다. SAS의 PROC MIXED를 R lme의 nlme패키지 기능과 비교하는 동안 다소 혼란스러운 차이점을 발견했습니다. 구체적으로는, 다른 시험에서 자유도간에 상이 PROC MIXED하고 lme, 그리고 왜 생각해. 다음 데이터 세트에서 시작하십시오 (아래 제공된 R 코드). ind : 측정 대상을 나타내는 계수 …
현재 ~ 300 개의 변수와 800 개의 관측치가있는 데이터 세트에서 이진 결과에 대한 예측 모델을 작성 중입니다. 이 사이트에서 단계별 회귀와 관련된 문제와 사용하지 않는 이유에 대해 많이 읽었습니다. 저는 LASSO 회귀와 기능 선택 기능을 읽고 "캐럿"패키지 및 "glmnet"을 사용하여 구현에 성공했습니다. 나는 최적으로 모델의 계수를 추출 할 수 있어요 …
다음은 mtcars데이터 세트 에서 생성 된 모델입니다 . > ols(mpg~wt+am+qsec, mtcars) Linear Regression Model ols(formula = mpg ~ wt + am + qsec, data = mtcars) Model Likelihood Discrimination Ratio Test Indexes Obs 32 LR chi2 60.64 R2 0.850 sigma 2.4588 d.f. 3 R2 adj 0.834 d.f. 28 Pr(> chi2) …
이 페이지의 예는 단순 회귀가 특이 치에 의해 크게 영향을받는 것으로 나타 났으며 이는 강력한 회귀 기술로 극복 할 수 있습니다 : http://www.alastairsanderson.com/R/tutorials/robust-regression-in-R/ . 나는 lmrob와 ltsReg가 다른 강력한 회귀 기술이라고 생각합니다. 왜 단순 회귀 (lm)를 수행하지 않고 매번 강력한 회귀 (rlm 또는 rq)를 수행하지 않아야합니까? 이러한 강력한 회귀 기술의 …