교육 게임에 대한 연구를하고 있으며 현재 진행중인 일부 프로젝트에는 BoardGameGeek (BGG) 및 VideoGameGeek (VGG)의 데이터를 사용하여 게임의 디자인 요소 (예 : "제 2 차 세계 대전에서 설정 됨", "롤링 주사위 포함") 간의 관계를 조사합니다. ) 및 해당 게임의 플레이어 등급 (예 : 10 점 만점). 이러한 각 디자인 요소는 BGG 또는 VGG 시스템의 태그와 일치하므로 본질적으로 이분법적인 변수입니다. 게임은 데이터베이스에 존재하는 모든 태그에 대해 1을, 존재하지 않는 모든 태그에 대해 0을 갖습니다.
이 태그는 수십 가지가 있으므로 탐색 적 요소 분석 (EFA)을 사용하여 게임 디자인의 패턴을 캡처하는 관리 가능한 수의 "장르"를 만들어 내고 싶습니다 . 여러 출처를 참고하면서, 나는 이분법 적 변수로 작업하고 있기 때문에 , 내 요인 (잠재적 특성 분석과 같은 다른 옵션들도 있음 )을 생각해 낼 때 Pearson 대신 다항식 상관 관계 ( 특히 4 분자) 를 사용해야 한다는 것을 이해합니다. 거기 있지만, 이것은 내가 지금 탐색하고있는 것입니다).
호기심으로, 나는 Pearson 상관 관계를 사용하는 하나와 다면적 상관 관계를 사용하는 다른 요소 (매번 같은 수의 요인)를 사용하는 두 가지 요인을 생각해 냈습니다. 내 문제는 Pearson 상관 관계를 사용하여 계산 된 요소가 다항식 상관 관계를 사용하여 계산 된 요소보다 훨씬 더 의미가 있고 해석하기 쉽다는 것입니다. 다시 말해서, 첫 번째 요인 세트의 "장르"는 직관적으로 이해되며 게임이 일반적으로 어떻게 설계되는지에 대한 나의 이해와 일치합니다. 그것은 두 번째 요인의 경우에는 해당되지 않습니다.
한편으로는 결과가 덜 예쁘더라도 사용중인 테스트의 가정을 충족 시키려고합니다. 다른 한편으로, 나는 요소 분석 및 (보다 광범위하게) 모델 구축의 목표 중 일부는 유용한 무언가를 생각해 내야하며, "규칙을 어길 때"더 유용한 정보가 나오고 있다고 생각합니다. 이 테스트의 가정을 위반하는 것보다 유용한 모델이 필요합니까? 다항식 대신 Pearson 상관 관계를 사용하면 어떤 결과가 발생합니까?