상용 응용 분야에서 사용할 수있는 SIFT / SURF에 대한 무료 대안은 무엇입니까?


66

내가 이해하는 한 SURF와 SIFT는 특허로 보호됩니다. 상용 응용 프로그램에서 자유롭게
사용할 수있는 대체 방법이 있습니까?

특허 확인에 대한 자세한 내용은 다음을 참조하십시오 : http://opencv-users.1802565.n2.nabble.com/SURF-protected-by-patent-td3458734.html


7
(아직) Eu은 포함되지 않습니다 - 그들은 단지 소프트웨어 특허를 허용하는 국가에서 특허를 기억
마틴 베켓

1
@MartinBeckett, 개발, 배포 또는 둘 다에 해당됩니까?
Andrey Rubshtein

2
그것은 소프트웨어 특허에 대한 까다로운 것입니다. 특허는 국가에서 제조 또는 판매를 중단하지만 연구 나 개발은하지 않습니다. 이제 소프트웨어 개발이란 무엇입니까?
Martin Beckett

SIFT의 특허는 무엇입니까? SIFT는 (i) 스케일 공간 구성, (ii) 키포인트 검출기 및 (iii) 디스크립터 생성기의 세 단계로 구성됩니다. 내 생각은 Descriptor Generator만이 특허를 받았다는 것입니다. 제가 맞습니까? 감사합니다

이것은 질문에 대한 답변이 아니며 답변이 아닌 의견에 속합니다.
ThP

답변:


62

SIFT 및 SURF 작성자 모두 원래 알고리즘 사용에 라이센스 비용이 필요합니다.

상황에 대한 조사를 수행했으며 가능한 대안은 다음과 같습니다.

키포인트 감지기 :

  • 해리스 코너 검출기
  • Harris-Laplace-규모가 변하지 않는 버전의 Harris 검출기 (Miklajczyk와 Schmidt가 제시 한 아핀 불변 버전도 존재하며 특허가 없다고 생각합니다).
  • 멀티 스케일 지향 패치 (MOP)-특허를 받았음에도 불구하고 검출기는 기본적으로 멀티 스케일 해리스이므로 문제가 없습니다 (설명자는 2D 웨이블릿 변환 이미지 패치입니다)
  • LoG 필터-특허를받은 SIFT는 DoG (Difference of Gaussian) 근사 LoG (Laplacian of Gaussian) 근사값을 사용하여 관심 지점을 규모에 맞게 분류 할 수 있으므로 LoG만으로는 수정없이 특허가없는 알고리즘에 사용할 수 있으며 구현이 약간 느려질 수 있습니다.
  • 빠른
  • BRISK (기술자 포함)
  • ORB (설명자 포함)
  • KAZE-무료 사용, M-SURF 디스크립터 (KAZE 비선형 스케일 공간을 위해 수정 됨), SIFT 및 SURF보다 성능이 우수
  • A-KAZE-가속 버전의 KAZE, 무료, M-LDB 디스크립터 (수정 된 빠른 이진 디스크립터)

키포인트 설명자 :

  • 정규화 된 그라디언트-간단한 작업 솔루션
  • PCA 변형 이미지 패치
  • 웨이블릿 변환 이미지 패치-세부 사항은 MOPs 논문에 나와 있지만 특허 문제를 피하기 위해 다르게 구현할 수 있습니다 (예 : 다른 웨이블릿 기반 또는 다른 색인 구성표 사용)
  • 방향 그라디언트의 히스토그램
  • 글로
  • 레쉬
  • 활발한
  • 변덕
  • LDB

관심 지점에 방향을 지정하고 그에 따라 이미지 패치를 회전하면 회전 불변이 무료로 제공됩니다. 해리스 코너도 회전 불변이며 디스크립터도 만들 수 있습니다.

Hugin에서는 특허가없는 관심 지점 탐지기를 갖기 위해 애 쓰고 있기 때문에 더 완벽한 솔루션이 Hugin에서 수행됩니다.


답변 주셔서 감사합니다. 그들은 왕족을 원합니까?
Andrey Rubshtein

1
네, 둘 다 로열티 수수료를 원합니다. 가격은 협상이 필요하지만 연간 약 20.000 USD이며 로열티 비용은 약 5 %입니다. MOP 는 이제 Microsoft에 의해 특허를 받았습니다 ( 특허에 대한 자세한 정보는 Richard Szeliski에 문의했습니다).
Libor

1
특허는 원칙적으로 공개되어 있으므로 이에 대해 더 자세히 알고 싶다면 특허 데이터베이스 (예 : 유럽 ​​데이터베이스) 에서 찾아보십시오 .
Geerten

이러한 핵심 요소 설명자 중 규모가 변하지 않습니까?
Diego

1
Harris-Laplace는 규모가 변하지 않습니다. 또는 스케일 공간 최대 값을 필터링하고 감지 된 각 포인트에 대한 특성 스케일을 계산하여 다른 검출기를 스케일 불변으로 만들 수 있습니다.
Libor

26

비교적 새로운 방법이 있습니다. BRISK , Binary Robust Invariant Scalable Keypoints :

본 논문에서는 키포인트 탐지, 설명 및 매칭을위한 새로운 방법 인 BRISK를 제안한다. 벤치 마크 데이터 세트에 대한 종합적인 평가 결과, 최신 알고리즘에서와 같이 BRISK의 적응 형 고품질 성능이 계산 비용이 획기적으로 낮지 만 (경우에 따라 SURF보다 훨씬 빠름) 밝혀졌습니다. 속도의 핵심은 각각의 키포인트 주변의 전용 샘플링에 의해 검색된 강도 비교로부터 비트 스트링 디스크립터의 조립과 조합 된 새로운 스케일 공간 FAST 기반 검출기의 적용에있다.

특허가 없으며 사용이 자유 롭습니다 (알고리즘 작성자가 말한대로).


12

여기 아무도 믿지 말고 변호사와 상담하십시오. 내가 말할 수 있다면 법 세계는 우리와 미묘하게 다릅니다. 정확히하고 싶은 일 (및 장소 등)에 따라 SURF 또는 SIFT를 사용할 수있는 솔루션이있을 수 있습니다. 과거에는 강력 해 보이는 라이센스를 어떻게 극복 할 수 있는지 놀랐습니다.


8

차라리 KAZE / AKAZE를 살펴보면 속도가 상당히 빨라집니다. 변형 사례도 허용됩니다. OpenCV는 최근 GSoC 2014를 통해 구현을 얻었습니다. 여기에서 찾을 수 있습니다 . OpenCV 튜토리얼도 여기에 있습니다 .


감사. KAZE는 유망 해 보입니다. SIFT / SURF보다 전반적인 성능이 더 좋습니다. 비선형 스케일 스케일 계산은 구현하기 어려울 수 있지만 노력할 가치가 있습니다.
Libor
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.