I, 즉 세 개의 변수 (365)의 관찰을 포함하는 데이터 세트를 pm
, temp
그리고 rain
. 이제 pm
다른 두 변수의 변경에 대한 응답 으로 동작을 확인하고 싶습니다 . 내 변수는 다음과 같습니다
pm10
= 응답 (종속)temp
= 예측 자 (독립)rain
= 예측 자 (독립적)
다음은 내 데이터의 상관 관계 매트릭스입니다.
> cor(air.pollution)
pm temp rainy
pm 1.00000000 -0.03745229 -0.15264258
temp -0.03745229 1.00000000 0.04406743
rainy -0.15264258 0.04406743 1.00000000
문제는 회귀 모델의 구성을 연구 할 때 첨가 방법이 반응 변수와 가장 관련이 높은 변수로 시작하는 것으로 작성되었습니다. 내 데이터 세트 rain
는 pm
(와 비교하여 temp
) 상관 관계가 높지만 동시에 더미 변수 (비 = 1, 비 = 0)이므로 이제 어디서부터 시작 해야하는지 단서가되었습니다. 제가 질문을 두 개의 이미지를 첨부 : 첫 번째는 데이터의 산점도이고, 두 번째 이미지의 산점도이다 pm10
대 rain
, 또한의 산점도 해석 할 수없는 나는 pm10
대를 rain
. 시작하는 방법을 알려줄 수 있습니까?