«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

3
데이터 불확실성을 기반으로 선형 회귀 기울기의 불확실성을 계산
데이터 불확실성 (아마도 Excel / Mathematica)을 기반으로 선형 회귀 기울기의 불확실성을 계산하는 방법은 무엇입니까? 예 : 데이터 포인트 (0,0), (1,2), (2,4), (3,6), (4,8), ... (8, 16)을 가지지 만 각 y 값은 불확실성 4. 내가 찾은 대부분의 함수는 점이 함수 y = 2x와 완벽하게 일치하기 때문에 불확실성을 0으로 계산합니다. 그러나 그림에 …

2
이분산성 및 잔차 정규성
나는 아주 좋은 선형 회귀를 가지고 있다고 생각합니다 (대학 프로젝트를위한 것이므로 정말로 정확할 필요는 없습니다). 요점은 잔차 대 예측 값을 플롯하면 (내 교사에 따르면)이 분산의 힌트가 있습니다. 그러나 잔차의 QQ-Plot을 플롯하면 정규 분포가 분명합니다. 또한 잔차에 대한 Shapiro 검정의 값은 이므로 잔차가 실제로 정규 분포인지 의심 할 여지가 없습니다.피피p0.80.80.8 질문 …


4
이 경우 포아송 회귀는 선형 회귀에 비해 어떤 이점이 있습니까?
나는 한 고등학교에서 학생들이 얻은 상 수를 포함하는 데이터 세트를 받았는데, 여기에서 획득 한 상 수의 예측 변수에는 학생이 등록한 프로그램 유형과 최종 시험 점수가 포함됩니다. 선형 회귀 모델이 왜이 경우에 적합하지 않은지, 왜 포아송 회귀를 사용하는 것이 더 좋은지 말해 줄 수 있을지 궁금합니다. 감사.

2
두 개의 선형 회귀 모델 비교
두 가지 조건에서 시간이 지남에 따라 mRNA의 분해 속도를 나타내는 두 개의 선형 회귀 모델을 비교하고 싶습니다. 각 모델의 데이터는 독립적으로 수집되었습니다. 다음은 데이터 세트입니다. 시간 (시간) 로그 (처리 A) 로그 (처리 B) 0 2.02 1.97 0 2.04 2.06 0 1.93 1.96 2 2.02 1.91 2 2.00 1.95 2 2.07 …

2
임의 포리스트에 대한 캐럿을 사용한 기능 선택 및 매개 변수 조정
수천 개의 기능이있는 데이터가 있으며 정보가없는 기능을 제거하기 위해 재귀 적 기능 선택 (RFE)을 수행하려고합니다. 캐럿 과 RFE 로이 작업을 수행합니다 . 그러나 최상의 회귀 적합도 (예 : 임의 포리스트)를 얻으려면 언제 매개 변수 조정 ( mtryRF)을 수행해야하는지 생각하기 시작했습니다 . 즉, 캐럿이 이해하는 것처럼 고정 mtry로 다른 기능 하위 …

3
두 시계열의 관계 : ARIMA
다음 두 시계열 ( x , y ; 아래 참조)을 고려할 때이 데이터의 장기 추세 간의 관계를 모델링하는 가장 좋은 방법은 무엇입니까? 두 시계열은 시간의 함수로 모델링 할 때 중요한 Durbin-Watson 테스트를 가지고 있으며 고정적이지 않습니다. 나는 이것이 기본적으로 arima (1,1,0 ), arima (1,2,0) 등 나는 당신이 그것들을 모델링하기 전에 …

3
지연된 DV를 도구 변수로 사용하는 이유는 무엇입니까?
나는 계량 경제학자가 아닌 이해하기 위해 고심하고있는 일부 데이터 분석 코드를 물려 받았습니다. 한 모델은 다음 Stata 명령을 사용하여 도구 변수 회귀 분석을 실행합니다. ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv) 이 데이터 세트는이 변수 세트에 대한 여러 순차적 관측치가있는 패널입니다. 이 코드가 DV의 지연된 값을 계측기로 …


3
코스 라 머신 러닝 코스 당 정규화 된 선형 회귀 비용 함수 도출
나는 몇 개월 전에 코스 트라를 통해 앤드류 응 (Andrew Ng)의 "머신 러닝 (Machine Learning)"과정을 수강했고, 대부분의 수학 / 유도에주의를 기울이지 않고 구현과 실용성에 중점을 두었습니다. 그 이후로 나는 기본 이론의 일부를 연구하기 시작했고 Ng 교수의 강의를 다시 방문했다. 나는 "Regularized Linear Regression"에 대한 강의를 읽고 그가 다음과 같은 비용 …

2
여러 예측 변수로 로지스틱 회귀 모델 해석
Y특정 진입 기간 동안 요양원에서 종속 변수 가 사망 한 다변량 로지스틱 회귀 분석을 수행 하고 다음과 같은 결과를 얻었습니다 (변수가 시작하면 변수 는 범주 A값이지만 B범주 가 시작하는 변수 는 범주 형입니다). Call: glm(Y ~ A1 + B2 + B3 + B4 + B5 + A6 + A7 + …
12 r  regression  logistic 

2
변수 벡터가 어떻게 초평면을 나타낼 수 있습니까?
통계 학습의 요소를 읽고 12 페이지 (섹션 2.3)에서 선형 모델은 다음과 같이 표기됩니다. Yˆ=XTβˆY^=XTβ^\widehat{Y} = X^{T} \widehat{\beta} ... 여기서 는 예측 변수 / 독립 변수 / 입력의 열 벡터의 전치입니다. (이전에는 "모든 벡터가 열 벡터로 가정된다"고 말 했으므로 를 행 벡터로 만들고 를 열 벡터로 만들지 않겠습니까?) X T βXTXTX^{T}XTXTX^{T}βˆβ^\widehat{\beta} …

1
왜 LKJcorr이 상관 매트릭스에 앞서 좋은가?
나는 Richard McElreath 가 쓴 (Re 훌륭한 ) 책 통계적 재검토 에서 13 장 "공분산의 모험"을 읽고 다음과 같은 계층 적 모델을 제시한다. ( R상관 행렬이다) 저자는 LKJcorr상관 관계 매트릭스의 정규화 이전으로 작동하는 약한 정보 이전이라고 설명합니다 . 그런데 왜 그래? LKJcorr분포가 어떤 특성을 가지고있어 상관 행렬에 우선 하기에 좋습니까? …

1
시계열 모델에서 R- 제곱을 사용할 때의 문제점은 무엇입니까?
시계열 컨텍스트에서 R- 제곱을 사용하는 것이 적절하지 않다는 것을 읽었습니다. 다른 컨텍스트가 있음을 알고 있습니다 .R- 제곱은 더 이상 고유하지 않습니다. 왜 이런거야? 나는 이것을 찾으려고했지만 아무것도 찾지 못했습니다. 일반적으로 모델을 평가할 때 R- 제곱 (또는 조정 된 R- 제곱)에 많은 가치를 두지 않지만 많은 동료 (예 : 비즈니스 전공)는 …

2
다중 선형 회귀 분석에 대한 최소 관측치 수
여러 선형 회귀 분석을 수행하고 있습니다. 21 개의 관측치와 5 개의 변수가 있습니다. 내 목표는 변수 간의 관계를 찾는 것입니다. 내 데이터가 다중 회귀를 수행하기에 충분히 설정 되었습니까? 내 변수 중 3 개가 유의하지 않은 것으로 밝혀진 t- 검정 결과. 중요한 변수로 회귀 분석을 다시 수행해야합니까 (또는 첫 회귀 분석으로 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.