선형 회귀 분석에서 인데 왜 X 가 설계 행렬이라고합니까? X 를 어느 정도 예술적으로 설계하거나 구성 할 수 있습니까 ?
선형 회귀 분석에서 인데 왜 X 가 설계 행렬이라고합니까? X 를 어느 정도 예술적으로 설계하거나 구성 할 수 있습니까 ?
답변:
@neverKnowsBest의 반응과 일치하는 예를 제공하기 위해 요인 실험에는 각각 2 개의 범주 변수로 취급되는 3 개의 요인이 있으며 요인 수준의 각 가능한 조합은 각 복제 내에서 테스트됩니다. 실험을 한 번만 수행하면 (복제 없음)이 설계에는 실행 이 필요 합니다. 실행은 다음 8x3 행렬로 설명 할 수 있습니다. 여기서 행은 런을 나타내고 열은 레벨을 나타냅니다. 요인 : 2 3 = 8 [ 0 0 0 1 0 0 0 1 0 1 1 0 0 0 1 1 0 1 0 1 1 1 1 1 ] [ B C ] .
AB & AC & BC & ABC \\ \ end {array} \ 오른쪽]. 두 매트릭스가 관련되어 있지만 설계 매트릭스는 데이터 수집 방법을 설명하는 반면 모델 매트릭스는 실험 결과를 분석하는 데 사용됩니다.[ I B C B C B C B C ].
인용
Montgomery, D. (2009). 실험 설계 및 분석, 7 판. 존 와일리 & 선즈
설계된 실험에서 우리는 종종 실험을 수행하는 요소의 수준을 포함 하는 설계 행렬 와 모델 행렬 ( 되었지만 실제로는 설계 행렬의 함수 임) 모든 1의 열 (절편 항을 나타냄)과 설계 행렬 열의 곱과 거듭 제곱 (상호 작용 및 다항식 모형 항을 나타냄)과 같은 것을 포함합니다. 모델 행렬의 에서 를 호출 합니다.X X y = X β
실험 설계는 데이터가 수집되기 전에 설계 매트릭스와 모델 매트릭스를 구성하는 방법에 중점을 둡니다. 데이터가 이미 수집 된 경우 설계가 석재로 설정되지만 모델 매트릭스를 계속 변경할 수 있습니다. 때때로 설계된 실험은 설계 행렬에서 제어 할 수 없지만 관찰 할 수있는 공변량 이라는 특정 고정 열을 갖게됩니다 .
모델 및 설계의 선택에 따라 발생할 수있는 몇 가지 사항이 있습니다. 특정 매개 변수를 추정하기 어려워 지거나 (추정기의 편차가 커짐) 특정 매개 변수를 전혀 추정하지 못할 수 있습니다. 적절한 모델을 결정하는 데는 예술의 일부 요소가 있으며 실험 설계에는 예술이 있습니다.
행렬 의 열 이 모델의 설계를 기반으로 하기 때문에 설계 행렬이라고합니다 . 나는 모델이 결정 되 자마자 디자인 매트릭스 (기본적으로 추정하려는 모든 대해 하나의 열)가 있다는 점에서 가 임의로 생성 될 수 있다고 생각하지 않습니다 . 그러나 모델 구축은 예술로 간주 될 수 있으므로 디자인 매트릭스를 구축 할 수 있다고 생각합니다.X X
는 단지 데이터입니다 (응답 변수 빼기). 모델의 "디자인"(훈련을 통해)을 정의하기 때문에 디자인 매트릭스라고합니다.
X를 어느 정도 예술적으로 설계하거나 구성 할 수 있습니까?
기본적으로이 질문은 "제조 된 데이터에 대해 훈련 된 모델을 만들 수 있습니까?"라는 대답으로 요약됩니다. 예를 들어, 사전 정의 된 기울기와 절편이있는 모델을 제공하는 임의의 설계 행렬 (실제로 설계 벡터)을 구성하는 한 가지 방법이 있습니다.
design_mat=function(b, a){
X = runif(100)
Y = a*X + b
data.frame(X,Y)
}
df = design_mat(-5, 12.3)
(lm(Y~X, data=df))
Call:
lm(formula = Y ~ X, data = df)
Coefficients:
(Intercept) X
-5.0 12.3
이 예에서는 설명을 위해 임의의 설계 데이터에서 응답을 "구성"했지만 사용하여 임의의 응답에서 설계 행렬을 쉽게 구성 할 수 있습니다 .