다변량 선형 모형을 다중 회귀로 캐스트


20

다변량 선형 회귀 모형을 다중 선형 회귀 모형으로 완전히 변환하는 것이 완전히 동일합니까? 단순히 실행을 언급하고 있지 않다 별도의 회귀.

나는 다변량 선형 모델 을 다중 회귀로 쉽게 다시 매개 변수화 할 수있는 몇 곳 (Bayesian Data Analysis-Gelman et al. 및 Multivariate Old School-Marden)에서 이것을 읽었습니다 . 그러나 어떤 소스도 이에 대해 자세히 설명하지 않습니다. 그들은 본질적으로 그것을 언급하고 다변량 모델을 계속 사용합니다. 수학적으로 다변량 버전을 먼저 작성하겠습니다.

와이×=엑스×케이케이×+아르 자형×,
여기서 굵은 체 변수는 아래에 크기가있는 행렬입니다. 평소와 같이 는 데이터이고 는 설계 행렬이고 은 정규 분포 잔차이며 는 우리가 추론하는 데 관심이있는 것입니다.X R B와이엑스아르 자형

이것을 친숙한 다중 선형 회귀로 다시 매개 변수화하기 위해 변수를 다음과 같이 간단히 다시 작성합니다.

와이×1=×케이β케이×1+아르 자형×1,

여기서 재 파라미터 화\ mathbf {y} = row (\ mathbf {Y})와이=아르 자형영형(와이) , β=아르 자형영형()=엑스나는 . 아르 자형영형() 는 행렬의 행이 긴 벡터로 끝나도록 배열되고 는 크로네 커 또는 외부 곱임을 의미합니다.

그래서 이것이 쉬운 경우, 왜 다변량 모델에 관한 책을 쓰고 귀찮게 하는가? 변수를 먼저 변환하고 일반적인 일 변량 기법을 사용하는 것이 가장 효과적입니다. 나는 합리적인 이유가 있다고 확신합니다. 최소한 선형 모델의 경우 하나를 생각하기가 어렵습니다. 다변량 선형 모델과 정규 분포 분포 랜덤 오류에이 매개 변수화가 적용되지 않거나 수행 할 수있는 분석 가능성이 제한되는 상황이 있습니까?

내가 본 출처 : Marden-다변량 통계 : Old School. 섹션 5.3-5.5를 참조하십시오. 이 책은 http://istics.net/stat/ 에서 무료로 제공됩니다.

Gelman et al. -베이지안 데이터 분석. 나는 두 번째 판을 가지고 있으며,이 판에는 Ch.에 작은 단락이있다. 19 '다변량 회귀 모델'제목 : "동일한 일 변량 회귀 모델"

기본적으로 다변량 모델로 할 수있는 동등한 선형 일 변량 회귀 모델로 모든 작업을 수행 할 수 있습니까? 그렇다면 왜 다변량 선형 모델에 대한 방법을 개발해야합니까?

베이지안 접근 방식은 어떻습니까?


좋은 질문입니다. 구조보다는 기초에 대해 더 많은 것을 요구할 수 있습니다.
Subhash C. Davar

1
구조가 아닌 기초가 무엇을 의미합니까? 좀 더 자세히 설명해 주시겠습니까?
bill_e

저의 첫 번째 및 대학원 학위 과정의 일부로 두 개의 논문 만 배웠으며 기술적 인 설명을 다루지 않았습니다. 다변량 분석은 다중 선형 회귀 또는 단순히 선형 회귀 모델과 비교할 때 다른 가정이 있음을 이해합니다. 다변량 분석에 대한 가정은 상이합니다. 즉 수학적 기대가 우선합니다. 다중 선형 회귀는 이분법을 유발하는 다른 가정을합니다. 여기서 의미하는 구조는 방정식을 나타냅니다.
Subhash C. Davar

다변량 (일반) 선형 모형 또는 베이지안 다변량 회귀 에 대해 말하고 있는지 제목이나 시작 부분에 명확하게 말해야합니다 .
ttnphns

1
좋아, 그래서. 그것은 접근 방식 이 아니고 , 나는 이것을 본 두 곳을 지적했다. 접근 방식이 문제의 핵심입니다. 다변량 버전과 재 파라미터 화 된 일 변량 버전의 차이점은 무엇입니까?
bill_e

답변:


5

기본적으로 다변량 모델로 할 수있는 동등한 선형 일 변량 회귀 모델로 모든 작업을 수행 할 수 있습니까?

나는 대답이 아니오라고 믿는다.

목표가 단순히 효과 ( 매개 변수)를 추정 하거나 모델을 기반으로 추가 예측을하는 것이라면, 둘 사이의 모델 공식을 채택하는 것은 중요하지 않습니다.

그러나, 특히 고전적 유의성 검정을 수행하기 위해 통계적 추론을하기 위해, 다변량 제제는 실질적으로 대체 불가능한 것으로 보인다. 좀 더 구체적으로 심리학의 일반적인 데이터 분석을 예로 들어 보도록하겠습니다. 과목 의 데이터 는 다음과 같이 표현됩니다n

Yn×t=Xn×kBk×t+Rn×t,

여기서 개체 간 설명 변수 (요소 또는 정량적 공변량)는 의 열로 코딩되는 반면 반복 측정 (또는 개체 내) 요소 수준은 동시 변수 또는 열 .X t Yk1엑스와이

위의 공식을 사용하면 일반적인 선형 가설을 다음과 같이 쉽게 표현할 수 있습니다.

=기음,

여기서 은 간 설명 변수 사이의 가중치로 구성되는 반면, 은 반복 측정 요소의 수준 사이의 가중치를 포함하며 는 상수 행렬, 일반적으로 .기음0

다변량 시스템의 아름다움은 개체 간 및 개체 내에서 두 가지 유형의 변수 사이의 분리에 있습니다. 다변량 프레임 워크 하에서 3 가지 유형의 유의성 테스트 (고전의 다변량 테스트, 반복 측정 다변량 테스트 및 반복 측정 단 변량 테스트)에 대한 쉬운 공식화를 허용하는 것이이 분리입니다. 또한, 구형도 위반에 대한 Mauchly 테스트 및 해당 수정 방법 (Greenhouse-Geisser 및 Huynh-Feldt)도 다변량 시스템의 단 변량 테스트에있어 자연스러워졌습니다. 이 통계 패키지와 같은 이러한 테스트를 구현 정확히 어떻게 자동차 R에 GLM 에서 IBM SPSS 통계에서, 반복 문 PROC GLM SAS의.

공식이 베이지안 데이터 분석에서 중요한지 확실하지 않지만 위의 테스트 기능이 일 변량 플랫폼에서 공식화되고 구현 될 수 있을지는 의문입니다.


알겠습니다. 큰 답변 감사합니다. 베이지안 관점도 듣고 싶습니다.
bill_e

@PeterRabbit 답변이 마음에 드시면 Bluepole에게 감사의 뜻을 전하십시오. 그는 포인트를 얻을 것이다.
pteetor

나는 누군가가 베이지안 관점을 제공 할 것인지 알기 위해 조금만 들고 있었다.
bill_e

4

적절한 분산 공분산 구조에 적합하면 두 모델이 동일합니다. 변환 된 선형 모델에서 사용 가능한 컴퓨팅 소프트웨어의 가용성이 제한적인 크로네 커 제품과 오차 성분의 분산 공분산 행렬을 맞출 필요가 있습니다. 선형 모형 이론-일 변량, 다변량 및 혼합 모형 은이 주제에 대한 훌륭한 참고 자료입니다.

편집

여기 또 다른 유용한 참고 자료가 있습니다.


2
보통 일 변량 모델에서는 DV 내에 "내부"공분산 구조가 없습니다. 따라서 해당 가설 검정은 존재하지 않습니다. 고맙습니다! 내가 그 책을 집을 수 있는지 볼 것이다.
bill_e
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.