훈련 된 신경망의 상관 관계 측정


9

비정규 분산 데이터를 사용하여 인공 신경망 (역 전파, 피드 포워드)을 훈련하고 있습니다. 근 평균 제곱 오차 외에, 문헌은 종종 훈련 된 그물의 품질을 평가하기위한 피어슨 상관 계수를 제안합니다. 그러나 훈련 데이터가 정규 분포가 아닌 경우 Pearson 상관 계수가 합리적입니까? 순위 기반 상관 측정 (예 : Spearman rho)을 사용하는 것이 더 합리적이지 않습니까?


정확히 사용하거나 참조하는 방법에 대해 자세히 설명해 주시겠습니까?
bayerj

답변:


6

피어슨 상관 계수는 선형 연관성을 측정합니다. 경험적인 두 번째 중심 모멘트를 기반으로하므로 극단적 인 가치의 영향을받습니다. 따라서:

  • 실제 대 예측 된 값의 산점도에서 비선형 성의 증거는 순위 상관 (Spearman) 계수와 같은 대안을 사용하는 것이 좋습니다.

    • 관계가 평균적으로 단조로 보이는 경우 (그림의 상단 열에서와 같이) 순위 상관 계수가 효과적입니다.

    • 그렇지 않은 경우, 관계는 곡선 형 (그림의 맨 아래 또는 가운데 U 자형과 같은 일부 예에서와 같이)이며 상관 관계의 측정 값이 적절하지 않은 설명 일 수 있습니다. 순위 상관 계수를 사용해도 문제가 해결되지 않습니다.

  • 산점도에 외부 데이터가 존재한다는 것은 피어슨 상관 계수가 선형 관계의 강도를 과장하고 있음을 나타냅니다. 정확하거나 정확하지 않을 수 있습니다. 주의해서 사용하십시오. 계급 상관 계수는 외부 값의 신뢰도에 따라 더 좋을 수도 있고 나쁠 수도 있습니다.

산점도 및 피어슨 상관의 예

( Pearson 곱-모멘트 상관 계수 에 대한 Wikipedia 기사에서 이미지를 복사했습니다 .)


회귀 성능을 측정하기 위해 순위 상관 사용에 대한 설명을 제공 할 수 있습니까?
Simon Kuang
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.