데이터 축소에 대한 반복 측정에서 PCA를 수행 할 수 있습니까?


13

나는 두 가지 상황에서 각각 87 마리의 동물에 대해 3 번의 실험을했습니다 (일부 누락 된 데이터; 누락 된 데이터 없음 = 64 마리의 동물). 내가 (그들에게 전화하는 상황에서 행동을 설명하는 2 ~ 3 복합 행동 점수를 개발하려는 있도록 맥락에서, 나는 많은 특정 조치를 (입력 시간, 쉼터로 돌아 횟수 등)이 C1, C2, C3). 나는 C13 번의 실험과 87 마리의 동물에 대해 같은 것을 의미하기 때문에 회귀를 통해 나이, 성별, 가계도 및 개별 동물이 행동에 미치는 영향을 조사 할 수 있습니다. 그런 다음 C1특정 연령 내에서 다른 상황에서 행동 점수와 어떤 관련이 있는지 조사하고 싶습니다 . (1 세에 문맥 1의 활동이 문맥 2의 활동을 강력하게 예측합니까?)

이 측정이 반복되지 않으면 PCA가 제대로 작동합니다. 컨텍스트의 여러 측정에 대해 PCA를 수행 한 다음 PC1, PC2 등을 사용하여 한 컨텍스트에서 PC1과 PC1 사이의 관계 (Spearman 상관 관계) (또는 2 또는 3) 다른 맥락에서. 문제는 반복 측정으로 의사 복제에 해당합니다. 나는 리뷰어가 범주 적으로 no-go라고 말했지만 데이터 축소를 수행 할 때 이것이 문제가되는지에 대한 명확한 언급을 찾을 수 없습니다.

나의 추론은 다음과 같다 : PCA에서 내가하고있는 것은 원래의 측정에 대한 순수한 설명이기 때문에 반복 된 측정은 문제가되지 않는다 . 피아트가 콘텍스트 1에서 "볼드 니스"척도로 경기장에 입장하는 데 시간을 사용한다고 선언했다면, 모든 연령대의 모든 개인들과 비교할 수있는 콘텍스트 1 대담성 측정 값을 가지게 될 것입니다. 피아트로 -to-enter -to-far-end 를 사용할 것이라고 선언 하면 동일하게 진행됩니다. 따라서 PCA를 환원 목적으로 순수하게 사용하는 경우 PC1이 아닌 이유는 무엇입니까 ( 입력 finish+ 0.5 0.28 + 0.63 + 0.02 0.5+ 0.50.28+ 0.63+ 0.02 총 시간 ...), 적어도 들어가는 시간이 일반적으로 유익하고 대표적인 특성이라고 생각하는 대신 내 여러 측정으로 적어도 통보됩니다.

(주요 측정의 기본 구조에 관심이 없습니다 ... 내 질문은 상황 별 행동을 해석하는 것에 관한 것입니다. "컨텍스트 1을 사용하고 다른 동물에 비해 해리가 활동적이라고 결론 내면 해리가 문맥 2에서 활동하고 있습니까? 그가 나이가 들어감에 따라 문맥 1에서 활동으로 해석하는 것을 바꾸면 문맥 2 활동도 변경됩니까?)

나는 PARAFAC을 보았고, SEM을 보았으며,이 두 가지 접근법 중 어느 것이나 내 표본 크기에 더 적합하거나 더 적합하다고 확신하지 않습니다. 아무도 무게를 달 수 있습니까? 감사.


나는 당신이이 피험자 내 요인이 있음을 정정 이해 했는가 : 1) 상황을 몇 가지 실험 조건 야외 실험 대 (예를 들어 실내 실험)에 의해하는 다릅니다이며, 2) 시험, 단순히 실험의 반복, 시도. 각 조건에서 PCA를 수행하고 싶지만 실험을 한 번만 수행 한 것이 아니라는 것을 막을 수 있습니다.
ttnphns

두 가지 상황은 두 가지 별도의 테스트이며 각각의 측정 방법이 다릅니다. 그렇습니다, 당신은 내 상황을 이해합니다.
Leann

세 번의 모든 시험에서 문제를 회피하고 PCA를 실행하는 것은 어떻습니까?
Gala

답변:


7

다중 요인 분석을 살펴볼 수 있습니다. 이것은 FactoMineR과 함께 R로 구현 될 수 있습니다.

최신 정보:

자세히 설명하기 위해 Leann은 오래 전부터 반복적 인 측정을 통해 데이터 세트에 대해 PCA를 수행 할 것을 제안했습니다. 데이터 세트의 구조를 올바르게 이해하면 주어진 '컨텍스트'에 대해 동물 x'특정 측정'(입력 시간, 보호소로 돌아 오는 횟수 등) 매트릭스를 가졌습니다 . 64 마리의 동물 (산부인과를 잃지 않은 동물) 각각을 3 회 추적했다. 그래서 그녀는 그 동물의 행동에 세 개의 64 × 10 행렬 것,의 그녀가 10의 특정 조치 '를 가지고 있다고 가정 해 봅시다 (우리가 행렬을 호출 할 수 있습니다 X1, X2, X3). 세 개의 매트릭스에서 PCA를 동시에 실행하려면 세 개의 매트릭스를 '행 바인딩'해야합니다 (예 :PCA(rbind(X1,X2,X3))). 그러나 이것은 첫 번째 관찰과 64 번째 관찰이 같은 동물에 있다는 사실을 무시합니다. 이 문제를 피하기 위해, 그녀는 3 개의 행렬을 '열 결합 (column bind)'하여 다중 인자 분석 (Multiple Factor Analysis)을 통해이를 실행할 수 있습니다. MFA는 서로 다른 시점에서 동일한 개인 또는 물체에 대해 측정 된 여러 변수 세트를 분석하는 유용한 방법입니다. 그녀는 PCA와 같은 방식으로 MFA에서 주요 구성 요소를 추출 할 수 있지만 각 동물에 대해 단일 좌표를 갖습니다. 동물 개체는 이제 그녀의 세 가지 관찰로 구분 된 다변량 타협 공간에 배치 될 것입니다.

그녀는 R의 FactoMineR 패키지를 사용하여 분석을 실행할 수 있습니다. 예제 코드는 다음과 같습니다.

df=data.frame(X1, X2, X3)
mfa1=MFA(df, group=c(10, 10, 10), type=c("s", "s", "s"), 
 name.group=c("Observation 1", "Observation 2", "Observation 3")) 
 #presuming the data is quantitative and needs to be scaled to unit variance

또한 MFA에서 처음 세 가지 구성 요소를 추출하여 다중 회귀 분석을 수행하는 대신 설명 변수를 MFA에 직접 '보충 테이블'로 투영하는 방법에 대해 생각할 수 있습니다 (참조 ?FactoMineR). 다른 접근법은 MFA로부터 물체 좌표의 유클리드 거리 매트릭스를 계산하고 (예를 들어 dist1=vegdist(mfa1$ind$coord, "euc")) dist1동물 특정 변수의 기능으로 (예 rda(dist1~age+sex+pedigree)를 들어 , 완전 채식 패키지를 사용하여) RDA를 통해 배치하는 것 입니다.


2
카일 안녕, 답변 주셔서 감사합니다. 그러나 본질적으로 링크 이상으로 구성되거나 문장의 길이에 불과한 답변은 일반적으로 답변으로 간주되지 않고 의견입니다. 특히 링크 전용 답변에는 링크 로트가 있으므로 링크가 더 이상 작동하지 않더라도 답변에 유용한 정보가 충분해야합니다. 답을 좀 더 확장하여 좀 더 일반적으로 요인 분석과 관련이있는 방법에 대한 간략한 개요를 제공 할 수 있습니까?
Glen_b-복지 모니카

(+1)이 게시물이 오래된 게시물이라는 것을 알고 있지만이 답변은 매우 유용합니다! 링크가 죽는 경우에 참조가 완전히 추가되어야 할 수도 있습니다 : Abdi Hervé, Williams Lynne J., Valentin Domininique. 다중 요인 분석 : 다중 테이블 및 다중 블록 데이터 세트에 대한 주성분 분석. WIREs Comp Stat 2013, 5 : 149-179. doi : 10.1002 / wics.1246
Frans Rodenburg

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.