디자인 매트릭스에서 "디자인"의 의미?


13

선형 회귀 분석에서 인데 왜 X 가 설계 행렬이라고합니까? X 를 어느 정도 예술적으로 설계하거나 구성 할 수 있습니까 ?Y=XβXX


3
이 용어의 기원은 꽤 오래되었고, 나는 실험 분석에서 추론 통계의 기원으로 되돌아 간다고 생각합니다. 특히, 나는 X- 행렬이 실제 실험 설계 ( x- 값 의 특정 설정)와 관련된 방식을 언급했다고 생각합니다 x. 특정 참조를 찾을 수 있으면 답변을 게시합니다.
Glen_b-복지 모니카

@Glen_b : 감사합니다! "design"은 입력 변수에서 변환을 선택하는 것과 관련이 있으므로 변환 된 입력 변수에서 출력 변수도 선형입니까? 예를 들어, 다항식 회귀 분석의 설계 행렬?
Tim

2
실험을 설계 할 때 X 값을 지정합니다 X.
whuber

답변:


15

@neverKnowsBest의 반응과 일치하는 예를 제공하기 위해 요인 실험에는 각각 2 개의 범주 변수로 취급되는 3 개의 요인이 있으며 요인 수준의 각 가능한 조합은 각 복제 내에서 테스트됩니다. 실험을 한 번만 수행하면 (복제 없음)이 설계에는 실행 이 필요 합니다. 실행은 다음 8x3 행렬로 설명 할 수 있습니다. 여기서 행은 런을 나타내고 열은 레벨을 나타냅니다. 요인 : 2 3 = 8 [ 0 0 0 1 0 0 0 1 0 1 1 0 0 0 1 1 0 1 0 1 1 1 1 1 ] [ B C ] .2323=8

[000100010110001101011111]
[ABC].
첫 번째 열은 요인 A, 두 번째 열 B 및 세 번째 열 C의 수준을 나타냅니다. 이것은이라고 디자인 매트릭스 는 실험의 디자인을 설명하기 때문이다. 첫 번째 실행은 모든 요인의 '낮은'수준에서 수집되고 두 번째 실행은 '높은'수준의 요인 A 및 '낮은'수준의 요인 B 및 C 등에서 수집됩니다.

AB & AC & BC & ABC \\ \ end {array} \ 오른쪽]. 두 매트릭스가 관련되어 있지만 설계 매트릭스는 데이터 수집 방법을 설명하는 반면 모델 매트릭스는 실험 결과를 분석하는 데 사용됩니다.[ I B C B C B C B C ].

[1000111011000011101001011110100010011001110101001011001011111111]
[IABCABACBCABC].

인용

Montgomery, D. (2009). 실험 설계 및 분석, 7 판. 존 와일리 & 선즈


9

설계된 실험에서 우리는 종종 실험을 수행하는 요소의 수준을 포함 하는 설계 행렬모델 행렬 ( 되었지만 실제로는 설계 행렬의 함수 임) 모든 1의 열 (절편 항을 나타냄)과 설계 행렬 열의 곱과 거듭 제곱 (상호 작용 및 다항식 모형 항을 나타냄)과 같은 것을 포함합니다. 모델 행렬의 에서 를 호출 합니다.X X y = X βXXXy=Xβ

실험 설계는 데이터가 수집되기 전에 설계 매트릭스와 모델 매트릭스를 구성하는 방법에 중점을 둡니다. 데이터가 이미 수집 된 경우 설계가 석재로 설정되지만 모델 매트릭스를 계속 변경할 수 있습니다. 때때로 설계된 실험은 설계 행렬에서 제어 할 수 없지만 관찰 할 수있는 공변량 이라는 특정 고정 열을 갖게됩니다 .

모델 및 설계의 선택에 따라 발생할 수있는 몇 가지 사항이 있습니다. 특정 매개 변수를 추정하기 어려워 지거나 (추정기의 편차가 커짐) 특정 매개 변수를 전혀 추정하지 못할 수 있습니다. 적절한 모델을 결정하는 데는 예술의 일부 요소가 있으며 실험 설계에는 예술이 있습니다.


2
이것은 매우 유용하지만 여기에 "공변량"에 대한 각주가 있습니다. 어떤 사람들 은 어떤 종류의 예측 변수 나 독립 변수에 대해이 용어를 훨씬 더 광범위하게 사용 합니다. (많은 다른 동의어가 자연스럽게 존재합니다.)
Nick Cox

(+1) 저희 사이트에 오신 것을 환영합니다.
whuber

2

행렬 의 열 이 모델의 설계를 기반으로 하기 때문에 설계 행렬이라고합니다 . 나는 모델이 결정 되 자마자 디자인 매트릭스 (기본적으로 추정하려는 모든 대해 하나의 열)가 있다는 점에서 가 임의로 생성 될 수 있다고 생각하지 않습니다 . 그러나 모델 구축은 예술로 간주 될 수 있으므로 디자인 매트릭스를 구축 할 수 있다고 생각합니다.X XXXXβ


2

X 는 단지 데이터입니다 (응답 변수 빼기). 모델의 "디자인"(훈련을 통해)을 정의하기 때문에 디자인 매트릭스라고합니다.

X를 어느 정도 예술적으로 설계하거나 구성 할 수 있습니까?

기본적으로이 질문은 "제조 된 데이터에 대해 훈련 된 모델을 만들 수 있습니까?"라는 대답으로 요약됩니다. 예를 들어, 사전 정의 된 기울기와 절편이있는 모델을 제공하는 임의의 설계 행렬 (실제로 설계 벡터)을 구성하는 한 가지 방법이 있습니다.

design_mat=function(b, a){
  X = runif(100)
  Y = a*X + b
  data.frame(X,Y)
}

df = design_mat(-5, 12.3)

(lm(Y~X, data=df))

Call:
lm(formula = Y ~ X, data = df)

Coefficients:
(Intercept)            X  
       -5.0         12.3  

이 예에서는 설명을 위해 임의의 설계 데이터에서 응답을 "구성"했지만 사용하여 임의의 응답에서 설계 행렬을 쉽게 구성 할 수 있습니다 .X=Yba

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.