나는 이진 처리 할당 지시자 와 함께 실험 / 무작위 통제 시험의 맥락에서 처리-공변량 상호 작용에 관심이있다 .
특정 방법 / 소스에 따라 치료 대상자와 치료하지 않은 대상에 대해 각각 및 을 모두 보았습니다 .
또는 을 사용할 때 경험할만한 규칙이 있습니까?
해석은 어떤면에서 다른가?
나는 이진 처리 할당 지시자 와 함께 실험 / 무작위 통제 시험의 맥락에서 처리-공변량 상호 작용에 관심이있다 .
특정 방법 / 소스에 따라 치료 대상자와 치료하지 않은 대상에 대해 각각 및 을 모두 보았습니다 .
또는 을 사용할 때 경험할만한 규칙이 있습니까?
해석은 어떤면에서 다른가?
답변:
지표 변수의 추정량과 절편의 해석은 서로 다릅니다. 시작하겠습니다 :
다음 모델이 있다고 가정 해보십시오.
어디
이 경우 대해 다음 공식으로 끝납니다 .
따라서 의 해석은 위약의 효과이고 β 1 의 해석은 위약의 효과와 약물의 효과의 차이입니다. 실제로, β 1 을 약물이 제공하는 개선으로 해석 할 수 있습니다 .
이제 보자 :
그런 다음 (다시) 다음 모델이 있습니다.
그러나 어디서
이 경우 대해 다음 공식으로 끝납니다 .
여기서 해석은 은 위약 효과와 약물 효과의 평균이며 β 1 은 두 치료의 평균과 그 평균의 차이입니다.
{ 0 , 1 } 에서 의 해석 은 기본적으로 기본입니다. 일부 표준 치료를 설정하고 다른 모든 치료 (여러 개가있을 수 있음)가 해당 표준 / 기준선과 비교됩니다. 특히 다른 공변량을 추가하기 시작하면 표준 의학적 질문과 관련하여 해석하기 쉽습니다. 이러한 약물은 위약 또는 기존 약물과 어떻게 비교됩니까?
그러나 결국 그것은 모두 해석의 문제입니다. 위에서 설명했습니다. 따라서 가설을 평가하고 결론을 이끌어내는 해석이 어떤 해석인지 확인해야합니다.
선형 회귀와 관련하여 은 이진 변수를 코딩하는보다 자연스럽고 표준적인 방법입니다 (회귀의 오른쪽에 배치하든 상관없이). @Jarko Dubbeldam이 설명했듯이 물론 다른 해석을 사용할 수 있으며 계수의 의미가 다릅니다.
출력 변수를 부호화하는 예를 다른 방법으로 정제하여 프로그래밍 또는 수학 기초 도출 할 때 표준 지원 벡터 머신 . (라이브러리를 호출 할 때 라이브러리가 예상하는 형식 (아마도 0, 1 형식)으로 데이터를 전달하려고합니다.)
수행 / 사용중인 모든 작업에 표준 표기법을 사용하십시오.
절편 항이있는 모든 종류의 선형 모형의 경우 두 방법은 간단한 선형 변환과 관련이 있다는 점에서 동일합니다. 수학적으로, 데이터 행렬 를 사용하는지 또는 데이터 행렬 을 사용하는지 ~ X = X A ( 여기서 A 는 전체 순위) 인지는 중요하지 않습니다 . 일반화 된 선형 모델에서 예상 된 계수 어느 방법은 선형 변환에 의해 관련된다 및 피팅 값 Y는 동일하다.
이것은 더 추상적이며 (아마도 쓸모가 없지만)이 두 표현은 수학적으로 실제로 그룹 표현이며 그 사이에 동형이 있습니다.