Spearman 상관 관계를 계산 한 데이터가 있으며이를 게시 용으로 시각화하려고합니다. 종속 변수는 순위가 매겨지고 독립 변수는 순위가 매겨지지 않습니다. 시각화하려는 것은 실제 기울기보다 일반적인 추세이므로 독립성을 평가하고 Spearman 상관 관계 / 회귀를 적용했습니다. 그러나 데이터를 플로팅하고 원고에 삽입하려고 할 때이 웹 사이트 에서이 내용을 우연히 발견했습니다 .
Spearman 순위 상관 관계 분석을 수행 할 때는 설명이나 예측에 회귀선을 거의 사용 하지 않으므로 회귀선에 해당하는 값을 계산하지 마십시오 .
그리고 나중에
선형 회귀 또는 상관 관계와 같은 방식으로 Spearman 순위 상관 관계 데이터를 그래프로 표시 할 수 있습니다. 그러나 그래프에 회귀선을 두지 마십시오 . 순위 상관 관계로 분석했을 때 선형 회귀선을 그래프에 표시하는 것은 잘못된 것입니다.
문제는 회귀선 이 독립성을 평가 하지 않고 Pearson 상관 관계를 계산할 때와 다르지 않다는 것입니다 . 추세는 동일하지만 저널의 컬러 그래픽에 대한 막대한 비용으로 인해 흑백 표현이 사용되었으며 실제 데이터 포인트가 너무 겹쳐서 인식 할 수 없습니다.
물론 두 가지 다른 플롯을 작성 하여이 문제를 해결할 수 있습니다. 하나는 데이터 포인트 (순위)와 회귀 라인 (비 순위)에 대한 것입니다. 그러나 인용 한 소스가 잘못되었거나 문제가있는 것으로 판명되면 내 경우에는 그 문제가 아니라 내 인생을 더 쉽게 만들 것입니다. (또한 이 질문 을 보았지만 도움이되지 않았습니다.)
추가 정보를 편집하십시오.
x 축의 독립 변수는 피처 수를 나타내고 y 축의 종속 변수는 성능에서 비교 알고리즘이 분류 알고리즘 인 경우 순위 알고리즘을 나타냅니다. 이제 평균적으로 비교할 수있는 알고리즘이 있지만 플롯으로 말하고 싶은 것은 다음과 같습니다. "분류기 A가 더 많을수록 더 많은 특징이 있으면 분류기 B가 더 적습니다.
플롯을 포함하도록 2를 편집하십시오.
플롯 된 알고리즘 수와 피처 수
플롯 된 알고리즘의 수와 순위의 기능 수
제목에서 질문을 반복하려면 다음을 수행하십시오.
Spearman 상관 관계 / 회귀 데이터의 등급 데이터에 대해 회귀선을 그릴 수 있습니까?