RANSAC이 통계에서 가장 널리 사용되지 않는 이유는 무엇입니까?


26

컴퓨터 비전 분야에서 나온 저는 종종 RANSAC (Random Sample Consensus) 방법을 사용하여 많은 특이 치가있는 데이터에 모델을 적합 시켰습니다.

그러나 나는 통계 학자들이 사용하는 것을 본 적이 없으며, "통계적으로 건전한"방법으로 간주되지 않았다는 인상을 항상 받았다. 왜 이렇게이다? 본질적으로 무작위이므로 분석하기가 어렵지만 부트 스트랩 방법도 마찬가지입니다.

아니면 단순히 학문적 사일로가 서로 이야기하지 않는 경우입니까?


1
컴퓨터 비전 방법과 통계 방법에 대해 한 가지 궁금합니다. 첫 번째 성능은 필수입니다. 성능과 "정확성"사이에 균형이있을 수 있으며 컴퓨터 비전과 통계는 이러한 변수의 가중치가 다릅니다.
루카스 Reis

답변:


10

여기서 핵심은 RANSAC에서 많은 양의 데이터를 버리는 것입니다.

대부분의 통계 적용에서 일부 분포는 꼬리가 짙을 수 있으므로 작은 표본 수가 통계적 추정을 왜곡 할 수 있습니다. 견고한 추정기는 데이터를 다르게 계량하여이 문제를 해결합니다. 반면에 RANSAC는 특이 치를 수용하려고 시도하지 않으며, 비정규 분산뿐만 아니라 데이터 포인트가 실제로 속하지 않는 경우를 위해 만들어졌습니다.


1
좋은 대답입니다. 나는 호모 그래피를 추정하기 위해 CV에서 RANSAC이 가장 많이 사용되는 것을 보았다. 이는 해당 측정 중 일부가 크게 신뢰할 수 없음을 알 때 가장 널리 사용됩니다. 또한 실시간 성능 및 기타 고려 사항으로 인해이 기술은 쉽게 병렬화 될 수 있으므로 매우 인기가 있습니다.
Luca

7

우리에게 이것은 강력한 회귀의 한 예일뿐입니다. 통계학 자도 사용한다고 생각하지만, 더 잘 알려진 대안이 있기 때문에 그렇게 넓지는 않을 것입니다.


1
대안의 예를 제시 할 수 있습니까? 나는 그것을 조사하고 싶습니다.
Bossykena

5
가장 널리 알려진 가장 간단한 방법은 스마트 계산기 (Sigh!)에서 잘 알려진 중앙값 중앙값 회귀입니다. 또한 Wikipedia en.wikipedia.org/wiki/Robust_regression 및 CRAN의 강력한 작업보기를 참조하십시오. cran.r-project.org/web/views/Robust.html

RANSAC에 대한 대안으로 편향 회귀뿐만 아니라 모형이 추정 된 데이터 포인트를 제공합니까? 감사합니다
Valerio

2

이것은 자주 사용되는 기술인 포장 과 비슷 합니다.


3
RANSAC는 매우 다릅니다. 포장에서 모든 샘플은 어떤 방식 으로든 고려됩니다. RANSAC는 최대 50 %의 데이터를 완전히 폐기해야하는 경우에 사용됩니다.
nbubis

1

RANSAC을 사용하여 데이터를 정당화하지 않고 모델의 적합도를 높이는 방식으로 데이터를 버립니다. 중요한 데이터를 잃을 수 있으므로 적합도를 높이기 위해 데이터를 버리는 것이 일반적입니다. 정당화없이 특이 치를 제거하는 것은 항상 문제가됩니다.

그것을 정당화하는 것은 물론 가능하다. 예를 들어 데이터가 주어진 패턴을 따라야하지만 측정 오류로 인해 패턴과 데이터의 편차가 있다는 것을 알고 있다면.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.