내 면책 조항 :이 질문이 한동안 휴면 상태에 있었음을 알지만 중요한 질문이자 여러 답변을 이끌어 낼 것입니다. 나는 사회 심리학자이며, 그 소리에서 아마도 Henrik보다 그러한 디자인에 약간 더 편안 할 것입니다. (인과적인 해석에 대한 그의 우려는 완전히 합법적입니다).
어떤 조건에서 SEM이 적절한 데이터 분석 기술입니까?
나 에게이 질문은 실제로 두 가지 별개의 하위 질문에 실제로 도달합니다.
- 왜 처음부터 SEM을 사용합니까?
- 연구원이 SEM을 사용하기로 결정한 경우 SEM 사용을위한 데이터 관련 요구 사항은 무엇입니까?
왜 처음부터 SEM을 사용합니까?
SEM은 다른보다 일반적인 일반 선형 모델링 방법 (예 : 분산 분석, 상관 관계, 회귀 및 확장 등)보다 데이터 분석에 대한 미묘하고 복잡하며 접근성이 떨어집니다. 이러한 접근 방식으로 생각할 수있는 모든 것은 SEM으로 할 수 있습니다.
따라서 사용자는 먼저 SEM을 사용해야하는 이유 를 먼저 강하게 평가해야한다고 생각합니다 . 확실히, SEM은 사용자에게 몇 가지 강력한 이점을 제공하지만 이러한 이점 중 어느 것도 활용되지 않는 논문을 검토했으며 최종 제품은 일반적인 독자가 이해하기 어려운 논문의 데이터 분석 섹션입니다. . SEM의 이점과 다른 데이터 분석 접근 방식의 이점을 얻지 못하면 연구원이나 독자에게 문제의 가치가 없습니다.
SEM 접근 방식의 주요 이점은 무엇입니까? 제 생각에 큰 것은 :
(1) 잠재 변수 모델링 : SEM을 통해 사용자는 관찰되지 않은 잠재 변수 간의 구조적 관계 (분산, 공분산 / 상관, 회귀, 그룹 평균 차이)를 조사 할 수 있으며, 이는 변수 그룹 (예 : 불안의 항목)간에 공유 공분산입니다. 학생들이 사용할 수도 있습니다).
잠재 변수 (예를 들어, 잠재 불안)를 분석하기위한 큰 판매 포인트는 구조물의 관찰 된 점수 (예를 들어, 불안 항목의 평균)가 잠재 변수에 오류가 없다는 것입니다. 잠재 변수는 공유 공분산으로 구성됩니다. 오류는 아무 것도없는 상태로 이론화됩니다. 이는 사용자가 더 이상 모델링하려고하는 효과를 약화시키는 측정 신뢰성에 대해 걱정할 필요가 없기 때문에 통계 능력을 향상시킵니다.
SEM 사용을 고려해야하는 또 하나의 더 절제된 이유는 어떤 경우에는 구조물에 대한 우리의 이론을 테스트하는 더 올바른 방법입니다. 예를 들어, 학생들이 3 가지의 다른 불안 척도를 사용했다면,이 3 가지 척도가 SEM 프레임 워크에서 공통적으로 (아마도 불안감) 가지고있는 것의 원인 / 결과를 이해하는 것이 더 좋지 않을 것입니다. 같은 특정 한 측정 불안의 측정?
(2) 다중 종속 변수 모델링: 누군가 잠복 변수를 모델링하기 위해 SEM을 사용하지 않더라도 하나의 모델에서 여러 결과 변수를 동시에 분석하기위한 프레임 워크로 여전히 유용 할 수 있습니다. 예를 들어, 학생들은 동일한 예측 변수가 여러 임상 적으로 관련된 여러 결과 (예 : 불안, 우울증, 외로움, 자부심 등)와 어떻게 연관되어 있는지에 관심이있을 수 있습니다. 관심있는 네 가지 결과 모두에 대해 하나의 모델 만 실행할 수 있는데 왜 네 가지 모델을 실행해야합니까 (유형 I 오류율 증가)? 이는 또한 여러 유형의 종속 응답자가 예측 및 결과 응답을 생성 할 수있는 특정 유형의 종속 데이터를 처리 할 때 SEM을 사용해야하는 이유입니다 (예 : 이진 데이터, Kenny, Kashy 및 Cook, 2006,
(3) 모델링 가정, 대신 : 데이터 분석에 대한 다른 많은 접근 방식 (예 : 분산 분석, 상관 관계, 회귀)을 사용하여 처리하는 데이터의 특성 (예 : 차이 / 호모 대 수성. SEM (일반적으로 잠재 변수 접근 방식과 결합)을 통해 사용자는 평균 및 / 또는 상관 관계 / 회귀 경로와 함께 분산 변수를 실제로 모델링 할 수 있습니다. 즉, 사용자는 변동성을 성가신 가정 관련 사후 고려로 취급하는 대신 평균 차이 / 공분산 성 외에도 변동성에 대한 이론을 세우고 테스트를 시작할 수 있습니다.
일부 변수의 그룹 평균 수준을 비교할 때 또 다른 테스트 가능한 가정은 해당 변수가 실제로 각 그룹과 동일한 것을 의미 하는지 여부입니다 (SEM 문헌의 측정 불일치 라고 함) (이 과정을 검토하려면 Vandenberg & Lance, 2000 참조). ). 그렇다면 해당 변수의 평균 수준에 대한 비교는 유효하지만 그룹이 무엇인지에 대해 상당히 다른 이해를하는 경우 그룹 간의 평균 수준을 비교하는 것은 의문의 여지가 있습니다. 우리는 그룹 비교를 이용한 연구에서 항상이 특정 가정을 암시 적으로 만듭니다.
그리고 집계 지수를 생성하기 위해 품목 점수를 평균하거나 합산 할 때 (예 : 불안 측정), 각 항목은 기본 구성의 동등하게 좋은 측정 값이라고 가정합니다 (각 항목의 가중치는 동일합니다). 평균 / 합산). SEM은 각 항목에 대해 다른 요인 로딩 값 (항목과 잠재 변수 간의 연관)을 추정하여 잠재 변수를 사용할 때 이러한 가정을 제거합니다.
마지막으로, SEM에 여전히 중요하지만 데이터에 대한 다른 가정 (예 : 정규성)은 데이터가 충족되지 않는 경우 (예 : "강력한"추정기를 사용하여 Finney & DiStefano, 2008 참조) 관리 할 수 있습니다. 특정 기준 (낮은 수준의 왜도 및 첨도).
(4) 모델 구속 조건 지정: SEM 사용을 고려해야하는 마지막 큰 이유는 모델의 특정 경로를 강제 (SEM 용어로 "제약")하여 데이터 모델에 대한 특정 가설을 매우 쉽게 테스트 할 수 있기 때문입니다. 특정 값을 취하고 이것이 모델의 데이터에 어떻게 영향을 미치는지 조사합니다. (A) 회귀 경로를 0으로 제한하여 모델에 필요한지 여부를 테스트합니다. (B) 다수의 회귀 경로를 크기가 동일하게 함유하는 것 (예를 들어, 일부 예측 자에 대한 연관 강도는 불안 및 우울증에 대해 대략 동일합니까?); (C) 측정 불균형을 평가하는데 필요한 측정 파라미터를 제한하는 것 (상기 설명 됨); (D) 회귀 경로가 두 개의 다른 그룹 사이에서 강도가 동일하도록 제한,
SEM의 데이터 관련 요구 사항은 무엇입니까?
SEM의 데이터 관련 요구 사항은 매우 적습니다. 적절한 표본 크기가 필요하며 데이터가 선택한 모형 추정기의 가정을 충족시키기 위해 (최대-유도가 일반적 임).
표본 크기에 대한 모든 권장 사항을 제시하기는 어렵습니다. 간단한 시뮬레이션을 바탕으로 Little (2013)은 매우 간단한 모형의 경우 100-150 개의 관측치로 충분할 수 있지만 모형이 더 복잡해 지거나 표본에 사용 된 변수의 신뢰성 / 유효성에 따라 표본 크기 요구가 증가 할 것이라고 제안합니다. 모델이 줄어 듭니다. 모델의 복잡성이 우려되는 경우 잠재 변수의 지표를 셀로 분류하는 것을 고려할 수 있지만이 접근 방식을 모두 갖춘 것은 아닙니다 (Little, Cunningham, Shahar, & Widaman, 2002). 그러나 일반적으로 말하면, 다른 모든 것이 동일하고 더 큰 표본 (저는 자체 연구에서 최소 200 분 동안 노력합니다)이 더 좋습니다.
선택한 추정량의 가정을 충족시키는 경우 일반적으로 평가하기가 매우 쉽습니다 (예 : 최대 우도 추정량에 대한 왜도 및 첨도 값 확인). 데이터가 가정 된 특성에서 벗어나더라도 연구는 "견고한"추정기 (Finney & DiStefano, 2008) 또는 다른 종류의 데이터를 가정하는 추정기 (예 : 대각선으로 가중 된 최소치와 같은 범주 형 추정기)의 사용을 고려할 수 있습니다. 사각형).
데이터 분석을위한 SEM의 대안?
연구원이 위에서 강조한 SEM 접근 방식으로 제공되는 이점을 활용하지 않을 경우 해당 분석의보다 간단하고 접근 가능한 버전을 고수하는 것이 좋습니다 (예 : t -테스트, 분산 분석, 상관 분석, 회귀 모델 (중재, 중재 및 조건부 프로세스 모델 포함). 독자는 그들에게 더 친숙하므로 더 쉽게 이해할 것입니다. 기본적으로 더 간단한 분석 방법과 동일한 효과에 SEM을 사용하는 경우 독자와 SEM을 혼동하지 않아도됩니다.
SEM 사용을 고려한 연구원들에게 조언을 하시겠습니까?
SEM을 처음 사용하는 경우 :
- 포괄적이고 접근하기 쉬운 기초 SEM 텍스트를 얻으십시오. 나는 Beaujean (2014), Brown (2015; 초판도 견고) 및 Little (2013; 나중에 세로 모델에 특히 초점을 맞추고 있지만 전반적으로 좋은 소개)을 좋아합니다.
- (Rosseel, 2012)
lavaan
용 패키지 사용 방법에 대해 알아보십시오 R
. 구문은 SEM 구문만큼이나 쉽고, 많은 사람들의 SEM 요구에 맞게 기능이 광범위하며 (초보자에게는 확실히) 무료입니다. Beaujean 책은 SEM과 lavaan
패키지에 대한 훌륭한 동시 소개를 제공 합니다.
- CrossValidated 및 StacksOverflow를 정기적으로 참조 / 사용하십시오. SEM 모델을 장착 할 때 예기치 않은 일이 발생할 수 있으며, 경험할 수있는 많은 이상한 일이 이미 설명되어 있고 스택에서 문제가 발생했을 가능성이 있습니다.
- Herik이 지적했듯이 인과 관계를 암시하는 모델을 지정한다고해서 SEM이 단면적 / 비 실험적 연구에서 인과 관계를 설정하는 데 도움이되는 것은 아닙니다. 또한 종단 및 / 또는 실험 설계의 데이터를 분석하기 위해 SEM을 사용하는 것을 고려해 볼 가치가 있습니다.
실제로 SEM을 사용하기 시작한 사람들에게 :
- 언젠가는 모델의 적합도를 높이기 위해 상관 잔차를 지정하려고 할 것입니다. 하지마 적어도 선험적 인 이유 없이는 아닙니다 . 더 자주, 더 큰 샘플 또는 더 간단한 모델이 치료법입니다.
- 잠복 변수에 대해 마커 변수 식별 방법을 사용하지 마십시오 (즉, 첫 번째 요인 로딩을 1로 고정). 대부분의 경우,이 경우를 가정 할 이유가없는 경우 해당 지표를 잠재적 변수의 "골드 표준"지표로 사용할 수 있습니다. 이것은 대부분의 프로그램에서 기본 식별 설정입니다.
참고 문헌
AA, Beaujean (2014). R을 사용한 잠재 변수 모델링 : 단계별 안내서 . 뉴욕, 뉴욕 : Routledge.
브라운, TA (2015). 응용 연구원에 대한 확인 요인 분석 (제 2 판). 뉴욕, 뉴욕 : 길 포드 출판사.
Finney, SJ, & DiStefano, C. (2008). 구조 방정식 모델링의 비정규 및 범주 형 데이터. GR Hancock & RD Mueller (Eds.)에서 구조 방정식 모델링 : 두 번째 코스 (pp. 269-314). 정보 시대 출판.
Kenny, DA, Kashy, DA, & Cook, WL (2006). 이진 데이터 분석 . 뉴욕, 뉴욕 : 길 포드 출판사.
Little, TD (2013). 종 방향 구조식 모델링 . 뉴욕, 뉴욕 : 길 포드 출판사.
Little, TD, Cunningham, WA, Shahar, G., & Widaman, KF (2002). 소포 또는 소포 : 질문을 탐구하고 장점을 평가합니다. 구조 방정식 모델링 , 9 , 151-173.
Rosseel, Y. (2012). lavaan : 구조식 모델링을위한 R 패키지. 통계 소프트웨어 저널 , 48 (2), 1-36.
Vandenberg, RJ, & Lance, CE (2000). 측정 불일치 문헌의 검토 및 합성 : 조직 연구원을위한 제안, 관행 및 권장 사항. 조직 연구 방법 , 3 , 4-70.