«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

2
변수가 변환 된 LM과 GLM이 다른 이유
이 과정 유인물 (1 페이지)에 설명 된대로 선형 모델은 다음 형식으로 작성 될 수 있습니다. y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, 여기서 yyy 는 반응 변수이고 xixix_{i} 는 ithithi^{th} 설명 변수. 테스트 가정을 충족시키기 위해 종종 응답 변수를 변환 할 수 있습니다. 예를 들어 …

1
벌점 형 회귀 분석에서 수축 매개 변수에 대해 가능한 가능한 값 범위는 무엇입니까?
올가미 또는 릿지 회귀에서는 종종 또는 α로 불리는 수축 매개 변수를 지정해야합니다 . 이 값은 종종 훈련 데이터에서 여러 가지 다른 값을 확인하고 테스트 데이터에서 어떤 R 2 가 가장 좋은지 확인함으로써 교차 검증을 통해 선택됩니다 . 확인해야 할 값의 범위는 무엇입니까? 그것은이다 ( 0 , 1 ) ?λλ\lambdaαα\alpha아르 자형2아르 …

2
추론에 대해 ARIMA 오류와 함께 회귀를 사용하는 경우의 정상 요구 사항은 무엇입니까?
추론을 위해 ARIMA 오류 (동적 회귀)와 함께 회귀를 사용할 때의 정상 요구 사항은 무엇입니까? 구체적으로, 나는 비정규 연속 결과 변수 , 비정규 연속 예측 변수 x a 및 더미 변수 처리 시리즈 x b가 있습니다. 치료가 제로 변화에서 2 표준 오차 이상인 결과 변수의 변화와 상관 관계가 있는지 알고 싶습니다.와이와이y엑스ㅏ엑스ㅏx_a엑스비엑스비x_b …


3
다 변수 회귀 분석에 변수를 더 추가하면 기존 변수의 계수가 변경됩니까?
3 개의 변수로 구성된 다 변수 (여러 독립 변수) 회귀 분석이 있다고 가정 해보십시오. 각 변수에는 주어진 계수가 있습니다. 4 번째 변수를 도입하고 회귀를 다시 실행하기로 결정한 경우, 3 개의 원래 변수 계수가 변경됩니까? 더 광범위하게 : 다 변수 (다중 독립 변수) 회귀 분석에서 주어진 변수의 계수가 다른 변수의 계수에 …

1
회귀 분석에서 데이터 센터링 및 표준화 필요
일부 정규화와 선형 회귀를 고려 : 예 찾기 것을 최소화 | | A x − b | | 2 + λ | | x | | 1xxx||Ax−b||2+λ||x||1||Ax−b||2+λ||x||1||Ax - b||^2+\lambda||x||_1 일반적으로 A의 열은 평균이 0이고 단위 규범을 갖도록 표준화되고 는 평균이 0이되도록 중앙에 배치됩니다. 표준화 및 센터링 사유에 대한 나의 이해가 …

2
직교 투영법의 투영 행렬이 왜 대칭입니까?
나는 이것에 익숙하지 않으므로 질문이 순진한 경우 용서하기를 바랍니다. (상황 : 나는 Davidson & MacKinnon의 저서 "Econometric Theory and Methods" 에서 계량 경제학을 배우고 있는데 이것을 설명하지 않는 것 같습니다. 또한 조금 더 진보 된 수준의 예측을 다루는 Luenberger의 최적화 책을 보았습니다. 운이 없다). 내가 직교 투영 와 관련 투영 …

4
클래식 선형 모델-모델 선택
5 개의 가능한 회귀 변수가있는 고전적인 선형 모델이 있습니다. 그것들은 서로 관련이 없으며 응답과의 상관 관계가 매우 낮습니다. 회귀 분석기 중 3 개가 t 통계량에 유의 한 계수를 갖는 모형에 도달했습니다 (p <0.05). 나머지 2 개의 변수 중 하나 또는 둘 다를 추가하면 t 통계에 대한 p 값> 0.05가 추가되고 …

2
R의 nls ()를 사용한 변화 점 분석
"change point"분석 또는 nls()R에서 다상 회귀 분석을 구현하려고합니다 . 여기 내가 만든 가짜 데이터가 있습니다. 데이터를 맞추기 위해 사용하려는 공식은 다음과 같습니다. 와이= β0+ β1x + β2최대 ( 0 , x − δ)와이=β0+β1엑스+β2최대(0,엑스−δ)y = \beta_0 + \beta_1x + \beta_2\max(0,x-\delta) 이것이해야 할 일은 특정 절편과 기울기 ( β0β0\beta_0 및 β1β1\beta_1 ) …

2
회귀에 대한 자연 큐빅 스플라인 정의
Hastie et al.의 "통계 학습 데이터 마이닝, 추론 및 예측의 요소"책에서 스플라인에 대해 배우고 있습니다. 145 페이지에서 자연 입방 스플라인이 경계 매듭 너머에 선형이라는 것을 알았습니다. 있습니다 매듭, ξ 1 , ξ 2 , . . . 스플라인의 ξ K 및 다음은이 스플라인의 스플라인에 대한 것입니다.KKKξ1,ξ2,...ξKξ1,ξ2,...ξK\xi_1, \xi_2, ... \xi_K 질문 …

1
선형 회귀에 대한 최소 점수
선형 회귀 분석을 통해 시간 경과에 따른 추세를 찾는 "합리적인"최소 관측치 수는 얼마입니까? 이차 모형 적합은 어떻습니까? 나는 건강 (SII, RII)에서 불평등의 복합 지수를 다루고 있으며, 단지 4 번의 설문 조사 만 있으므로 4 점 (1997,2001,2004,2008)입니다. 나는 통계학자는 아니지만 4 포인트로는 충분하지 않은 직관적 인 인상을 받았습니다. 답변이나 참고 사항이 …
16 regression 

1
lmer 모델에 사용할 다중 비교 방법 : lsmeans 또는 glht?
하나의 고정 효과 (조건)와 두 개의 임의 효과 (대상 내 설계 및 쌍으로 인해 참가자)가있는 혼합 효과 모델을 사용하여 데이터 세트를 분석하고 있습니다. lme4패키지로 모델이 생성되었습니다 exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). 다음으로, 고정 효과 (조건)없이 모형에 대해이 모형의 우도 비 검정을 수행했으며 유의 한 차이가 있습니다. 내 데이터 세트에는 3 가지 조건이 있으므로 다중 …

3
statsmodel OLS와 scikit 선형 회귀의 차이점
동일한 작업을 수행하는 다른 라이브러리의 두 가지 다른 방법에 대한 질문이 있습니다. 선형 회귀 모델을 만들려고합니다. 다음은 OLS와 함께 statsmodel 라이브러리를 사용하는 코드입니다. X_train, X_test, y_train, y_test = cross_validation.train_test_split(x, y, test_size=0.3, random_state=1) x_train = sm.add_constant(X_train) model = sm.OLS(y_train, x_train) results = model.fit() print "GFT + Wiki / GT R-squared", results.rsquared …

2
L2 표준 손실에 고유 한 솔루션이 있고 L1 표준 손실에 여러 솔루션이있는 이유는 무엇입니까?
http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/ 이 글의 상단을 보면 L2 규범에는 고유 한 솔루션이 있고 L1 규범에는 아마도 많은 솔루션이 있다고 언급합니다. 나는 정규화 측면에서 이것을 이해하지만 손실 함수에서 L1 규범 또는 L2 규범을 사용하는 관점에서는 이해하지 못합니다. 스칼라 x (x ^ 2 및 | x |)의 함수 그래프를 보면 두 가지 고유 한 …

7
백분율 데이터에 어떤 종류의 곡선 (또는 모형)을 적용해야합니까?
바이러스 사본과 게놈 범위 (GCC) 간의 관계를 보여주는 그림을 만들려고합니다. 이것은 내 데이터의 모습입니다 : 처음에는 선형 회귀를 플로팅했지만 관리자가 잘못되었다고 말하고 시그 모이 드 곡선을 시도한다고 말했습니다. 그래서 geom_smooth를 사용 하여이 작업을 수행했습니다. library(scales) ggplot(scatter_plot_new, aes(x = Copies_per_uL, y = Genome_cov, colour = Virus)) + geom_point() + scale_x_continuous(trans = …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.