범주 형 예측 변수와 연속 예측 변수가 혼합 된 경우 다중 회귀 분석을 사용할 수 있습니까?

12

하나의 범주 형 변수에 대해 코딩을 사용할 수있는 것처럼 보이지만 두 개의 범주 형 변수와 하나의 연속 예측 변수가 있습니다. SPSS에서 이것을 위해 다중 회귀를 사용할 수 있습니까? 그렇다면 어떻게합니까? 감사!

나는 당신이 할 수 있다고 확신 하지만, 나는 어떻게하는지 전혀 모른다 .

— onestop

SPSS와 함께 제공되는 도움말 문서에 회귀 와 같은 것을 입력하는 것이 좋습니다 . 어떤 통계 패키지의 빵과 버터 물건이어야한다

— probabilityislogic

하나의 범주 형 변수를 코딩하여 무슨 뜻인지 모르겠습니다. 구문으로 예를 들어 줄 수 있습니까? 종속 변수가 연속적이거나 범주 형입니까?

— 앤디 W

8

이것이 SPSS 구문 질문 인 경우, 답변은 범주 형 변수를 적절하게 코딩 된 연속 변수와 함께 "독립 변수"에 대한 변수 목록에 넣습니다.
통계 : 범주 형 변수가 바이너리입니까? 그렇다면 더미 또는 다른 유효한 대비 코드를 사용해야합니다. 이항이 아닌 경우 범주 형 변수가 순서 또는 공칭입니까? 명목 형인 경우 다시 대조적 인 코드 전략을 사용해야합니다. 결과적으로 각 변수 레벨이 결과 또는 "종속"변수에 미치는 영향을 모델링합니다. 범주 형 변수가 순서 형인 경우 대부분합리적인 예측 방법은 연속 예측 변수 (예 : "독립") 변수를 사용하는 것처럼 모델에 그대로 입력하는 것입니다. 이 경우 범주 형 예측 변수 ( "독립적") 변수 수준 사이의 증분이 있다고 가정합니다. 이 실수는 드물지만 그럴 때는 다시 대비 코드를 사용하고 각 레벨의 영향을 모델링해야합니다. 여기 좋은의이다 -이 질문은 매우 자주이 포럼에서 제공 analaysis
누락 된 데이터를 처리하는 방법은 완전히 별도의 문제입니다. 내 이해는 쌍별 삭제가 다변량 회귀에 대한 올바른 접근 방식으로 간주되지 않는다는 것입니다. Listwise는 꽤 일반적이지만 결과를 바이어스 할 수 있으며 확실히 수치입니다. 다중 대치는 아름다움의 것입니다.

— dmk38
소스

DMK38에 대한 질문이 있습니다. 위에서는 순 서형일 때 범주 형 변수를 그대로 모델에 추가해도됩니다. 나는 이것을 읽게되어 기쁘다 ;-) 당신은 그것을 내 논문에 추가 할 수 있도록 그것을 언급하는 좋은 출처가 있습니까? 대답 해 주셔서 감사합니다! 릴리안

— 릴리안 Jans-Beken 10

1

@ LilianJans-Beken : 순서 독립 변수 및 로지스틱 회귀 및 순서 독립 변수가있는 연속 종속 변수를 참조하십시오 . 더 복잡한 방법을 사용하고 싶지 않을 수도 있지만 예측 변수를 구간 척도로 간주하더라도 반응과 선형 관계를 갖도록 제한 할 필요는 없습니다. 그리고 다른 것이 더 합리적으로 보인다면 인접한 레벨 사이에 동일한 간격 을 가정 할 의무가 없습니다 .

— Scortchi-Monica Monica 복원

1

@ LilianJans-Beken : 또한 서수 범주 형 변수를 독립 변수로 처리하는 방법 및 서수 독립 변수를 사용하는 로짓 . 아, 그리고 교차 검증에 오신 것을 환영합니다!

— Scortchi-Monica Monica 복원

2

첫 번째 범주 형 예측 변수에 사용하는 것과 동일한 방법을 따르면됩니다. 첫 번째 변수와 마찬가지로 더미 변수를 만듭니다. 그러나 종종 SPSS의 Unianova 명령을 사용하는 것이 더 쉽습니다. 인쇄 또는 PDF로 작성된 구문 안내서에서이 내용을 보거나 분석 ... 일반 선형 모형 ... 일 변량을 통해 액세스 할 수 있습니다.

조금 더 복잡하지만 회귀 명령에는 Unianova보다 많은 장점이 있습니다. 가장 중요한 것은 '쌍별 결측'을 선택할 수 있다는 것입니다 (단, 하나 또는 두 개의 예측 변수 값이 없어서 사례를 잃을 필요는 없습니다). 또한 부분 도표 및 영향 통계와 같은 많은 유용한 진단을 얻을 수 있습니다.

— 롤란도
소스

1

@ rolando-좋은 대답. 즉, 쌍으로 접근하지 않으면 서로 다른 수의 관측 값을 기반으로하므로 효과 비교를 혼동하는 경향이 있습니다. 명심해야 할 것이있을 수 있습니다.

— richiemorrisroe

단계적으로 모델 선택 절차를 사용하는 것과 같이 완전히 별개의 모델을 실행하는 경우에만 약간 혼란스럽고 페어 단위 누락이 중요하다고 생각합니다. 모델에 모든 변수를 입력하면 결 측값이 목록별로 삭제됩니다.

— 앤디 W

@ richiemorrisroe-명심할 가치가 있음에 동의합니다. @ Andy W-방금 SPSS에서 강제 입력 만 사용하여 쌍으로 누락되고 목록으로 누락되면 다른 df를 포함하여 모든 측면에서 다른 결과를 제공함을 확인했습니다.

— rolando2

SPSS가 누락 된 데이터의 값을 구성하지 않는 한 누락 된 쌍으로 선언하여 어떻게 다른 결과 집합을 반환 할 수 있습니까? 다음은 텍스트 파일 dl.dropbox.com/u/3385251/SPSS_missing_Listwise_vs_Pairwise.txt에 게시 한 시뮬레이션 데이터를 사용하는 예 입니다. 누락 된 데이터를 처리하는 회귀 명령이 혼란스럽고 OP의 원래 질문과 아무런 관련이 없으며 오해의 소지가 있기 때문에 귀하의 답변을 하향 조정했습니다.

— 앤디 W

1

SPSS에서 모델에 사용하기 위해 범주 형 변수를 더미 변수 세트로 변환하는 간단한 방법은 do repeat 구문을 사용하는 것입니다. 범주 형 변수가 숫자 순서 인 경우 사용하는 것이 가장 간단합니다.

*making vector of dummy variables.
vector dummy(3,F1.0).
*looping through dummy variables using do repeat, in this example category would be the categorical variable to recode. 
do repeat dummy = dummy1 to dummy3 /#i = 1 to 3.
compute dummy = 0.
if category = #i dummy = 1.
end repeat.
execute.

그렇지 않으면 단순히 일련의 if 문을 실행하여 더미 변수를 만들 수 있습니다. 내 현재 버전 (16)에는 회귀 명령에서 더미 변수 세트를 자동으로 지정할 수있는 기본 기능이 없지만 ( xi 명령을 사용하여 Stata에서 할 수있는 것처럼 ) 최신 버전에서 사용할 수 있다면 놀라지 않을 것입니다. 또한 dmk38의 포인트 # 2에 주목하십시오.이 코딩 체계는 명목 범주를 가정합니다. 변수가 서수이면 더 많은 재량을 사용할 수 있습니다.

또한 dmk38에 동의하며 누락 된 데이터를 특정 방식으로 지정하는 기능으로 인해 회귀가 더 나아진다는 이야기는 완전히 별개의 문제입니다.

— 앤디여
소스