범주 형 변수 (R)에 사용할 수있는 다양한 코딩 유형은 무엇이며 언제 사용합니까?


14

선형 모델 또는 혼합 모델에 적합하면 범주 형 또는 명목 형 변종을 더미 콘딩 (R 기본값) 및 효과 코딩과 같이 매개 변수가 추정되는 여러 변수로 변환하는 데 사용할 수있는 다양한 유형의 코딩이 있습니다.

상호 작용이있을 때 효과 코딩 (때로는 편차 또는 대비 코딩이라고 함)이 선호된다고 들었지만 가능한 대비는 언제이며 어떤 유형의 대비를 사용 하시겠습니까?

컨텍스트를 사용하여 R에서 혼합 모델링을 사용 lme4하지만 더 넓은 응답이 좋습니다. 비슷한 질문을 놓친 경우 죄송합니다.

편집 : 두 가지 유용한 링크가 있습니다 : 효과 코딩더미 코딩 설명.


당신이 S 플러스와 현대 응용 통계가 있다면, 그것은 바로이 질문에 대한 제 6 장에 큰 부분이있다
richiemorrisroe

4
귀하의 질문에 대한 완전한 답변을 찾을 수는 없지만 다양한 유형의 코딩에 대한 좋은 정보가 많이 있습니다 .
복원

@gung이 사이트는 정말 흥미로워 보입니다. 그러나 대비 코딩을 다루지 않는 것 같습니다 (또는 다른 이름이 있습니다).
Henrik

잘 모르겠습니다. 잘못된 의사 소통이 있는지 궁금합니다. 해당 페이지의 제목은 "대비 코딩"입니다.
gung-모니 티 복원

1
어떤 질문이 남아 있는지 잘 모르겠습니다. 다른 유형의 코딩 목록을 원한다면 그 유형이 있습니다. 지금 당신의 질문의 주요 추력은 무엇입니까?
gung-모니 티 복원

답변:


4

내가 틀렸다면 다른 사람들이 나를 깨우칠 수 있지만 여기에 간다…

이전 레벨의 평균과 비교하여 레벨의 효과는 무엇입니까? 즉, 효과의 임계 값을 찾는 데 관심이 있습니다.

  • Helmert 대비를 사용하십시오. 나는 이것을 누적 비교라고 생각합니다. 나는 노출의 약물 용량-반응 한계를 결정하는데 관심이있을 때 이것을 사용했다. 한 번에 여러 수준을 비교하면 적은 정보가 버려집니다. 나는 이것을 누적 비교라고 생각합니다.

기준 레벨에 상대적인 레벨의 효과는 무엇입니까? 즉, 하나의 기준선 비교 그룹에 관심이 있습니다.

  • 더미 변수 코딩 (처리 대비)을 사용하십시오. 나는 이것을 기준선 비교라고 생각합니다. 나는 다른 연구에 의해 중요하게 설정된 하나의 그룹 / 레벨이있을 때 이것을 사용했으며, 나의 연구는이 임계 값을 초과 할 때 연관성이 존재 함을 보여주고있다.

변수의 인접한 두 수준의 효과는 무엇입니까?

  • 앞으로 / 뒤로 차이를 사용하십시오. 나는 이것을 짧은 간격의 연속적인 비교라고 생각합니다. 나는 각 그룹이 자신의 권리에있어 구성이 다르고 다른 것보다 더 관심이 없을 때, 다른 수준의 사회 경제적 위치에 대한 효과를 비교할 때 이것을 사용했다.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.