밀접하게 관련된 여러 종류의 곤충에 형태 학적 날개 문자를 설명하는 불연속 (선정적, meristic 및 명목) 변수에 대한 데이터 세트가 있습니다. 제가하고자하는 것은 형태 학적 특성에 따라 다른 종의 유사성을 시각적으로 나타내는 일종의 분석을 수행하는 것입니다. 떠올랐다 것을 우선 (이 내가 만들 찾고 있어요 시각화의 유형입니다) PCA했지만, 같은 특히 다른 질문 (그것으로 찾고 후 : 캔 주성분 분석은 연속의 혼합을 포함하는 데이터 세트에 적용 할 수 범주 형 변수?) PCA가 불연속 데이터에 적합하지 않은 것 같습니다 (PCA는 이러한 유형의 연구에서 문헌에 사용되지만 항상 지속적인 데이터를 사용함). 이 데이터가 왜 부적절한 지에 대한 통계적 배경을 무시하면서, PCA는 나의 생물학적 질문에 관해 상대적으로 완벽한 결과를 제공합니다 (하이브리드 관심 그룹은 부모 그룹의 중간에 있습니다).
또한 통계를 완화하기 위해 다중 대응 분석을 시도했지만 (적어도 내 이해는 가능한 한) PCA에서 얻을 수있는 것과 비슷한 음모를 얻을 수없는 것 같습니다. 다른 그룹 (생물학적으로 말하기, 다른 종)을 보여주기 위해 색으로 구분됩니다. 이 분석은 변수 (여기서, 나의 형태 학적 특성)가 개별 관측치가 아니라 서로 관련되는 방식을 설명하는 것으로 보입니다. 그리고 그룹별로 채색 된 관측치를 플롯하면 전체 개인 집합을 설명하는 단일 값 (아마도 평균) 만 얻습니다. 나는 R에서 분석을 했으므로 음모에 대한 나의 아이디어가 작동하기에 R이 충분하지 않을 수도 있습니다.
내 데이터로 이런 종류의 분석을 시도하는 것이 맞습니까? 당신이 말할 수 없다면, 나의 통계 전문 지식이 제한되어 있기 때문에, 이러한 분석에서 일어나는 방정식은 내 머리 위로 끝납니다. 나는이 분석을 완전히 묘사 적으로 수행하려고 노력하고 있습니다 (더 이상 다운 스트림 번호 크 런칭을 할 필요가 없습니다).이 경우 PCA로 충분하다는 것을 읽었지만 너무 많은 통계적 가정을 위반했습니다.