심리학에서 관찰 연구를 분석하기 위해 구조 방정식 모델링을 사용할지 여부

통계 컨설팅 설정에서이 문제가 많이 발생하는 것을 보았으며 귀하의 의견을 듣고 싶어했습니다.

문맥

나는 종종 다음과 같이 연구를 수행 한 연구생들에게 말합니다 :

관측 연구
샘플 크기는 100, 200, 300 등일 수 있습니다.
여러 가지 심리적 척도 (예 : 불안, 우울증, 성격, 태도, 기타 임상 척도, 아마도 지능 등)가 측정되었습니다.

연구자들은 관련 문헌을 읽고 가능한 인과 과정에 대해 몇 가지 생각을했다. 종종 선행 변수, 프로세스 변수 및 결과 변수로 변수에 대한 일반적인 개념이있을 것입니다. 또한 구조 방정식 모델링이 연구중인 변수 세트 사이의 관계에 대한 전체 모델을 테스트하는 데 더 적합하다고 들었습니다.

의문

어떤 조건에서 구조 방정식 모델링이 그러한 연구를 분석하기에 적합한 기술이라고 생각하십니까?
구조 방정식 모델링을 권장하지 않는 경우 어떤 대체 기술을 권장 하시겠습니까?
이 경우 구조 방정식 모델링 사용을 고려할 때 연구원에게 어떤 조언을 해 주겠습니까?

— 제로미 앵림
소스

내 면책 조항 :이 질문이 한동안 휴면 상태에 있었음을 알지만 중요한 질문이자 여러 답변을 이끌어 낼 것입니다. 나는 사회 심리학자이며, 그 소리에서 아마도 Henrik보다 그러한 디자인에 약간 더 편안 할 것입니다. (인과적인 해석에 대한 그의 우려는 완전히 합법적입니다).

어떤 조건에서 SEM이 적절한 데이터 분석 기술입니까?

나 에게이 질문은 실제로 두 가지 별개의 하위 질문에 실제로 도달합니다.

왜 처음부터 SEM을 사용합니까?
연구원이 SEM을 사용하기로 결정한 경우 SEM 사용을위한 데이터 관련 요구 사항은 무엇입니까?

왜 처음부터 SEM을 사용합니까?

SEM은 다른보다 일반적인 일반 선형 모델링 방법 (예 : 분산 분석, 상관 관계, 회귀 및 확장 등)보다 데이터 분석에 대한 미묘하고 복잡하며 접근성이 떨어집니다. 이러한 접근 방식으로 생각할 수있는 모든 것은 SEM으로 할 수 있습니다.

따라서 사용자는 먼저 SEM을 사용해야하는 이유 를 먼저 강하게 평가해야한다고 생각합니다 . 확실히, SEM은 사용자에게 몇 가지 강력한 이점을 제공하지만 이러한 이점 중 어느 것도 활용되지 않는 논문을 검토했으며 최종 제품은 일반적인 독자가 이해하기 어려운 논문의 데이터 분석 섹션입니다. . SEM의 이점과 다른 데이터 분석 접근 방식의 이점을 얻지 못하면 연구원이나 독자에게 문제의 가치가 없습니다.

SEM 접근 방식의 주요 이점은 무엇입니까? 제 생각에 큰 것은 :

(1) 잠재 변수 모델링 : SEM을 통해 사용자는 관찰되지 않은 잠재 변수 간의 구조적 관계 (분산, 공분산 / 상관, 회귀, 그룹 평균 차이)를 조사 할 수 있으며, 이는 변수 그룹 (예 : 불안의 항목)간에 공유 공분산입니다. 학생들이 사용할 수도 있습니다).

잠재 변수 (예를 들어, 잠재 불안)를 분석하기위한 큰 판매 포인트는 구조물의 관찰 된 점수 (예를 들어, 불안 항목의 평균)가 잠재 변수에 오류가 없다는 것입니다. 잠재 변수는 공유 공분산으로 구성됩니다. 오류는 아무 것도없는 상태로 이론화됩니다. 이는 사용자가 더 이상 모델링하려고하는 효과를 약화시키는 측정 신뢰성에 대해 걱정할 필요가 없기 때문에 통계 능력을 향상시킵니다.

SEM 사용을 고려해야하는 또 하나의 더 절제된 이유는 어떤 경우에는 구조물에 대한 우리의 이론을 테스트하는 더 올바른 방법입니다. 예를 들어, 학생들이 3 가지의 다른 불안 척도를 사용했다면,이 3 가지 척도가 SEM 프레임 워크에서 공통적으로 (아마도 불안감) 가지고있는 것의 원인 / 결과를 이해하는 것이 더 좋지 않을 것입니다. 같은 특정 한 측정 불안의 측정?

(2) 다중 종속 변수 모델링: 누군가 잠복 변수를 모델링하기 위해 SEM을 사용하지 않더라도 하나의 모델에서 여러 결과 변수를 동시에 분석하기위한 프레임 워크로 여전히 유용 할 수 있습니다. 예를 들어, 학생들은 동일한 예측 변수가 여러 임상 적으로 관련된 여러 결과 (예 : 불안, 우울증, 외로움, 자부심 등)와 어떻게 연관되어 있는지에 관심이있을 수 있습니다. 관심있는 네 가지 결과 모두에 대해 하나의 모델 만 실행할 수 있는데 왜 네 가지 모델을 실행해야합니까 (유형 I 오류율 증가)? 이는 또한 여러 유형의 종속 응답자가 예측 및 결과 응답을 생성 할 수있는 특정 유형의 종속 데이터를 처리 할 때 SEM을 사용해야하는 이유입니다 (예 : 이진 데이터, Kenny, Kashy 및 Cook, 2006,

(3) 모델링 가정, 대신 : 데이터 분석에 대한 다른 많은 접근 방식 (예 : 분산 분석, 상관 관계, 회귀)을 사용하여 처리하는 데이터의 특성 (예 : 차이 / 호모 대 수성. SEM (일반적으로 잠재 변수 접근 방식과 결합)을 통해 사용자는 평균 및 / 또는 상관 관계 / 회귀 경로와 함께 분산 변수를 실제로 모델링 할 수 있습니다. 즉, 사용자는 변동성을 성가신 가정 관련 사후 고려로 취급하는 대신 평균 차이 / 공분산 성 외에도 변동성에 대한 이론을 세우고 테스트를 시작할 수 있습니다.

일부 변수의 그룹 평균 수준을 비교할 때 또 다른 테스트 가능한 가정은 해당 변수가 실제로 각 그룹과 동일한 것을 의미 하는지 여부입니다 (SEM 문헌의 측정 불일치 라고 함) (이 과정을 검토하려면 Vandenberg & Lance, 2000 참조). ). 그렇다면 해당 변수의 평균 수준에 대한 비교는 유효하지만 그룹이 무엇인지에 대해 상당히 다른 이해를하는 경우 그룹 간의 평균 수준을 비교하는 것은 의문의 여지가 있습니다. 우리는 그룹 비교를 이용한 연구에서 항상이 특정 가정을 암시 적으로 만듭니다.

그리고 집계 지수를 생성하기 위해 품목 점수를 평균하거나 합산 할 때 (예 : 불안 측정), 각 항목은 기본 구성의 동등하게 좋은 측정 값이라고 가정합니다 (각 항목의 가중치는 동일합니다). 평균 / 합산). SEM은 각 항목에 대해 다른 요인 로딩 값 (항목과 잠재 변수 간의 연관)을 추정하여 잠재 변수를 사용할 때 이러한 가정을 제거합니다.

마지막으로, SEM에 여전히 중요하지만 데이터에 대한 다른 가정 (예 : 정규성)은 데이터가 충족되지 않는 경우 (예 : "강력한"추정기를 사용하여 Finney & DiStefano, 2008 참조) 관리 할 수 있습니다. 특정 기준 (낮은 수준의 왜도 및 첨도).

(4) 모델 구속 조건 지정: SEM 사용을 고려해야하는 마지막 큰 이유는 모델의 특정 경로를 강제 (SEM 용어로 "제약")하여 데이터 모델에 대한 특정 가설을 매우 쉽게 테스트 할 수 있기 때문입니다. 특정 값을 취하고 이것이 모델의 데이터에 어떻게 영향을 미치는지 조사합니다. (A) 회귀 경로를 0으로 제한하여 모델에 필요한지 여부를 테스트합니다. (B) 다수의 회귀 경로를 크기가 동일하게 함유하는 것 (예를 들어, 일부 예측 자에 대한 연관 강도는 불안 및 우울증에 대해 대략 동일합니까?); (C) 측정 불균형을 평가하는데 필요한 측정 파라미터를 제한하는 것 (상기 설명 됨); (D) 회귀 경로가 두 개의 다른 그룹 사이에서 강도가 동일하도록 제한,

SEM의 데이터 관련 요구 사항은 무엇입니까?

SEM의 데이터 관련 요구 사항은 매우 적습니다. 적절한 표본 크기가 필요하며 데이터가 선택한 모형 추정기의 가정을 충족시키기 위해 (최대-유도가 일반적 임).

표본 크기에 대한 모든 권장 사항을 제시하기는 어렵습니다. 간단한 시뮬레이션을 바탕으로 Little (2013)은 매우 간단한 모형의 경우 100-150 개의 관측치로 충분할 수 있지만 모형이 더 복잡해 지거나 표본에 사용 된 변수의 신뢰성 / 유효성에 따라 표본 크기 요구가 증가 할 것이라고 제안합니다. 모델이 줄어 듭니다. 모델의 복잡성이 우려되는 경우 잠재 변수의 지표를 셀로 분류하는 것을 고려할 수 있지만이 접근 방식을 모두 갖춘 것은 아닙니다 (Little, Cunningham, Shahar, & Widaman, 2002). 그러나 일반적으로 말하면, 다른 모든 것이 동일하고 더 큰 표본 (저는 자체 연구에서 최소 200 분 동안 노력합니다)이 더 좋습니다.

선택한 추정량의 가정을 충족시키는 경우 일반적으로 평가하기가 매우 쉽습니다 (예 : 최대 우도 추정량에 대한 왜도 및 첨도 값 확인). 데이터가 가정 된 특성에서 벗어나더라도 연구는 "견고한"추정기 (Finney & DiStefano, 2008) 또는 다른 종류의 데이터를 가정하는 추정기 (예 : 대각선으로 가중 된 최소치와 같은 범주 형 추정기)의 사용을 고려할 수 있습니다. 사각형).

데이터 분석을위한 SEM의 대안?

연구원이 위에서 강조한 SEM 접근 방식으로 제공되는 이점을 활용하지 않을 경우 해당 분석의보다 간단하고 접근 가능한 버전을 고수하는 것이 좋습니다 (예 : t -테스트, 분산 분석, 상관 분석, 회귀 모델 (중재, 중재 및 조건부 프로세스 모델 포함). 독자는 그들에게 더 친숙하므로 더 쉽게 이해할 것입니다. 기본적으로 더 간단한 분석 방법과 동일한 효과에 SEM을 사용하는 경우 독자와 SEM을 혼동하지 않아도됩니다.

SEM 사용을 고려한 연구원들에게 조언을 하시겠습니까?

SEM을 처음 사용하는 경우 :

포괄적이고 접근하기 쉬운 기초 SEM 텍스트를 얻으십시오. 나는 Beaujean (2014), Brown (2015; 초판도 견고) 및 Little (2013; 나중에 세로 모델에 특히 초점을 맞추고 있지만 전반적으로 좋은 소개)을 좋아합니다.
(Rosseel, 2012) lavaan용 패키지 사용 방법에 대해 알아보십시오 R. 구문은 SEM 구문만큼이나 쉽고, 많은 사람들의 SEM 요구에 맞게 기능이 광범위하며 (초보자에게는 확실히) 무료입니다. Beaujean 책은 SEM과 lavaan패키지에 대한 훌륭한 동시 소개를 제공 합니다.
CrossValidated 및 StacksOverflow를 정기적으로 참조 / 사용하십시오. SEM 모델을 장착 할 때 예기치 않은 일이 발생할 수 있으며, 경험할 수있는 많은 이상한 일이 이미 설명되어 있고 스택에서 문제가 발생했을 가능성이 있습니다.
Herik이 지적했듯이 인과 관계를 암시하는 모델을 지정한다고해서 SEM이 단면적 / 비 실험적 연구에서 인과 관계를 설정하는 데 도움이되는 것은 아닙니다. 또한 종단 및 / 또는 실험 설계의 데이터를 분석하기 위해 SEM을 사용하는 것을 고려해 볼 가치가 있습니다.

실제로 SEM을 사용하기 시작한 사람들에게 :

언젠가는 모델의 적합도를 높이기 위해 상관 잔차를 지정하려고 할 것입니다. 하지마 적어도 선험적 인 이유 없이는 아닙니다 . 더 자주, 더 큰 샘플 또는 더 간단한 모델이 치료법입니다.
잠복 변수에 대해 마커 변수 식별 방법을 사용하지 마십시오 (즉, 첫 번째 요인 로딩을 1로 고정). 대부분의 경우,이 경우를 가정 할 이유가없는 경우 해당 지표를 잠재적 변수의 "골드 표준"지표로 사용할 수 있습니다. 이것은 대부분의 프로그램에서 기본 식별 설정입니다.

참고 문헌

AA, Beaujean (2014). R을 사용한 잠재 변수 모델링 : 단계별 안내서 . 뉴욕, 뉴욕 : Routledge.

브라운, TA (2015). 응용 연구원에 대한 확인 요인 분석 (제 2 판). 뉴욕, 뉴욕 : 길 포드 출판사.

Finney, SJ, & DiStefano, C. (2008). 구조 방정식 모델링의 비정규 및 범주 형 데이터. GR Hancock & RD Mueller (Eds.)에서 구조 방정식 모델링 : 두 번째 코스 (pp. 269-314). 정보 시대 출판.

Kenny, DA, Kashy, DA, & Cook, WL (2006). 이진 데이터 분석 . 뉴욕, 뉴욕 : 길 포드 출판사.

Little, TD (2013). 종 방향 구조식 모델링 . 뉴욕, 뉴욕 : 길 포드 출판사.

Little, TD, Cunningham, WA, Shahar, G., & Widaman, KF (2002). 소포 또는 소포 : 질문을 탐구하고 장점을 평가합니다. 구조 방정식 모델링 , 9 , 151-173.

Rosseel, Y. (2012). lavaan : 구조식 모델링을위한 R 패키지. 통계 소프트웨어 저널 , 48 (2), 1-36.

Vandenberg, RJ, & Lance, CE (2000). 측정 불일치 문헌의 검토 및 합성 : 조직 연구원을위한 제안, 관행 및 권장 사항. 조직 연구 방법 , 3 , 4-70.

— jsakaluk
소스

+1 좋은 답변. 나는 당신의 다른 기여를 기대하고 있습니다!

— Momo

+1 좋은 답변입니다. 나는 당신이하는 말의 대부분에 동의합니다. 하나의 후속 조치 : SEM이 잠재 변수 간의 관계를 추정하기 때문에 더 큰 통계적 힘을 가지고 있다고 생각하지 않습니다. 일반적으로 SEM이 추가 오류를 유발한다고 생각합니다. 따라서 관측 된 변수를 추정 할 때 일반적인 오류가 발생하며 잠재 된 구조의 오류 분산 또는 기타 요소를 추정 할 때 추가 오류가 발생합니다.

— Jeromy Anglim

나는 SEM이 고유 한 요인으로 오류를 모델링함으로써 실제로 전력을 증가 시킨다고 주장한다. 이것은 잠재 평균의 그룹 차이의 SEM 모델을 관찰 된 평균 차이의 모델과 비교함으로써 가장 쉽게 입증 될 수 있다고 생각한다. 같은 데이터. 효과 코딩 방식을 사용하여 SEM을 실행하는 경우 (Little, Slegers, & Card, 2006 참조) 각 그룹의 잠재 수단은 관찰 된 수단과 동일한 값을 갖습니다. 그러나 SEM 모델의 각 그룹에 대한 분산은 관측 된 것보다 작기 때문에 감지하기 쉬운 효과 크기가 더 커집니다.

— jsakaluk

위의 의견이 귀하의 우려에 응답하는 최선의 방법이 아닐 수도 있음을 알고 있습니다. SEM에 대해 별도의 질문을하고 CV를 켜는 경우 도움이 될 수있는 몇 가지 출력 예를 통해보다 자세한 답변을 게시 해 드리겠습니다.

— jsakaluk

면책 조항 : 나는 실험에 중점을 둔 전문 심리학자라고 생각합니다. 따라서 나는 이와 같은 디자인으로 자연스럽게 불안해합니다.

첫 번째와 두 번째 질문에 대답하기 위해 : 나는 이와 같은 디자인을 SEM으로 생각하거나 관련된 변수의 수에 따라 중재 또는 중재 분석이 데이터를 처리하는 자연스러운 방법이라고 생각합니다. 무엇을 추천해야할지 모르겠습니다.

세 번째 질문 : 나는 이와 같은 디자인의 주요 이점이 주요 단점이라고 생각합니다. 즉 당신 (충분한 변수 주어가) 있다는 것입니다 의미있는 결과를 찾을 수 있습니다. 문제는 이러한 결과를 어떻게 해석 하는가입니다.

즉, 심리학 적 의미로 해석 할 수있는 중요한 (SEM을 거부한다는 의미가 아닌) 의미를 찾을 수있는 너무 많은 가설 (일부 관련 문헌에서 덜 영감을 얻은)을 볼 수 있습니다. 따라서이 작업을 수행하는 사람에게 내 충고는 두 가지입니다.

이러한 설계의 인과 적 해석으로 문제를 강조하십시오. 나는 이것에 대한 전문가는 아니지만, 직관적으로 그럴듯한 소리를내는 방법에 관계없이 완전한 단면 디자인을 인과 적으로 해석하기가 거의 불가능하다는 것을 알고 있습니다. 교차 지연 형 pnael 디자인과 같은 고급 디자인 또는 이와 유사한 것들이 인과 관계에 필요합니다. Shadish, Cook & Campbell (또는 그중 일부)의 작품은 이러한 주제에 대한 추가 토론을위한 좋은 자료라고 생각합니다.
개인의 책임과 과학 윤리를 강조하십시오. 초기 아이디어가 데이터에서 지원되지 않는 경우 데이터를 추가로 검사하는 것이 자연스럽게 다음 단계입니다. 그러나, 당신은 절대로 HARKing에 의존해서는 안됩니다 (결과가 알려진 후에 가설; Kerr, 1998 , Maxwell, 2004 참조 ). 즉, 데이터를 감안할 때 가설을 적절하게 조정하는 것과 상당한 결과를 버는 체리 선택 사이에는 얇은 선이 있다는 것을 강조해야합니다.

— 헨릭
소스

그리고 Bernd : Ditto! 큰 약어와 나는 그것이 붙잡기를 바랍니다.

— rolando2