방금 브라운 / 거리 공분산 / 상관에 대해 막연하게 소개되었습니다 . 의존성을 테스트 할 때 많은 비선형 상황에서 특히 유용합니다. 그러나 공분산 / 상관 관계가 종종 비선형 / 카오스 데이터에 사용되는 경우에도 자주 사용되지 않는 것 같습니다.
그것은 거리 공분산에 몇 가지 단점이있을 수 있다고 생각합니다. 그렇다면 그것들은 무엇이며 왜 모두가 항상 거리 공분산을 사용하지 않습니까?
방금 브라운 / 거리 공분산 / 상관에 대해 막연하게 소개되었습니다 . 의존성을 테스트 할 때 많은 비선형 상황에서 특히 유용합니다. 그러나 공분산 / 상관 관계가 종종 비선형 / 카오스 데이터에 사용되는 경우에도 자주 사용되지 않는 것 같습니다.
그것은 거리 공분산에 몇 가지 단점이있을 수 있다고 생각합니다. 그렇다면 그것들은 무엇이며 왜 모두가 항상 거리 공분산을 사용하지 않습니까?
답변:
아래 나열된 참고 문헌을 읽은 결과에 따라 거리 공분산에 대한 몇 가지 의견을 수집하려고했습니다. 그러나 나는이 주제에 대해 나 자신을 전문가로 생각하지 않습니다. 의견, 수정, 제안 등을 환영합니다.
이 발언은 원래 질문에서 요청한대로 잠재적 인 단점으로 (강하게) 편향되어 있습니다.
내가 본 것처럼 잠재적 인 단점은 다음과 같습니다.
반복해서 말하면,이 대답은 아마도 매우 부정적인 것입니다. 그러나 그것은 의도가 아닙니다. 거리 공분산과 관련하여 매우 아름답고 흥미로운 아이디어가 있으며 그것의 상대적인 참신 성은 또한 그것을 더 완전히 이해하기위한 연구 길을 열어줍니다.
참고 문헌 :
나는 뭔가를 놓칠 수는 있지만 두 변수 사이의 비선형 의존성을 정량화하는 것은 많은 이익을 얻지 못하는 것 같습니다. 관계의 형태를 알려주지는 않습니다. 하나의 변수를 다른 변수에서 예측하는 수단을 제공하지 않습니다. 유추하여 탐색 적 데이터 분석을 할 때 때때로 직선, 2 차, 3 차 등으로 데이터가 가장 잘 모델링되는지 여부를 확인하기위한 첫 번째 단계로 황토 곡선 (로컬 가중치 산포도 평활)을 사용하기도합니다. 그 자체로는 매우 유용한 예측 도구가 아닙니다. 이변 량 모양을 설명하기 위해 실행 가능한 방정식을 찾는 방법에 대한 첫 번째 근사치입니다. 이 방정식은 황토 (또는 거리 공분산 결과)와 달리 확인 모델의 기초를 형성 할 수 있습니다.