깊이 이미지를 대상으로하는 컴퓨터 비전 알고리즘이 있습니까?


9

Kinect 기반 응용 프로그램과 함께 사용할 마커 감지 알고리즘을 살펴 보았으며 찾은 대부분의 작업은 '정상'이미지의 기능 감지에 중점을 둡니다.

그러나 Kinect 하드웨어는 픽셀 당 11 비트 심도 값을 제공합니다 (실제로 조정 한 후에는).

이 심도 이미지에는 물체의 가장자리 주위에 드리 워진 그림자로부터 다양한 시각적 인공물이 있습니다 (예 : http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).

기존의 머신 비전 기술 (예 : 에지 감지)은이 기능과 잘 작동하지만 다른 기능은 그렇지 않으며, 네트워크에 대해 논의 할 정보가 거의없는 것 같습니다.

간단한 예로 깊이 값을 사용하면 마커 블록을 찾은 후 방향을 감지하기가 쉽지 않습니다.

특징 탐지를위한 깊이 이미지 처리를 다루는 토론 / 종이 등을 본 사람이 있습니까?

누구든지 "깊이"마커 (인쇄 된 흑백 마커 대신 종이 접기 블록을 효과적으로 감지)를위한 훌륭한 알고리즘을 추천 할 수 있습니까?

내가 지금까지 한 것은 이미지를 처리하기 위해 opencv를 사용하는 임시 실험이었습니다. 그러나 그것은 거의 안정적이거나 빠르지 않습니다.

시험판없이 상업용 머신 비전 제품에 연결하는 경우 적절한 이유를 답에 기재하십시오.


이를위한 수많은 논문과 프로그램이 있습니다. 낮은 대역폭에서는 더 자세하게 답변 할 수 없습니다. RGBDemo 앱을 참조하십시오. 여기에는 객체 인식기가 포함되어 있습니다. 또한 소프트웨어의 경우 PCL (PointCloud Library), ROS, OpenCV, 논문의 경우 Google Scholar가있을 수 있습니다. OpenCV는 만족스럽지 않지만 PCL 및 RGBDemo는 적합 할 수 있습니다.

Kinect를 보여주는 데모 구현 또는 Kinect 또는 이미지 처리 툴킷 (예 : opencv)에서 3D 모델을 생성하는 방법을 보여주는 일부 PC 데모를 찾고 있지 않습니다. 깊이 이미지를 기반으로 기능 인식을 위한 알고리즘 을 찾고 있습니다.

RGBDemo는 이러한 알고리즘을 구현합니다. 코드 또는 코드 참조를 읽으십시오.

답변:


8

등록 및 인식을 위해 제가 가장 좋아하는 2.5D / 3D 기능 설명자는 스핀 이미지 (원본 + CMU에서 제공하는 박사 학위 논문소프트웨어에 대한 자세한 내용 )입니다.

다른 최근의 진보 (적절한 알고리즘을 위해 검색 가능한 모든 온라인)에는 3D-Sift, Fast Point Feature Histogram, NRF (Normal Aligned Radial Features), Depth Kernel Descriptors가 포함됩니다. 이전 방법에서는 곡률 및 가장자리와 같은 표면 특성을 사용하여 영역 패치를 식별했습니다.

어느 것이 가장 좋은가요? 찾고자하는 것, 시점 불일치, 추가 클러 터 등에 따라 다릅니다.


7

당신은 모든 핵심 단어를 올바르게 얻었습니다. 자료를 찾는 동안 관련 기사를 찾지 못했다는 것이 놀랍습니다.

다행히도 IEEE Xplore 디지털 라이브러리에 액세스 할 수 있습니다. 나는이 특정 알고리즘 중 어느 것도 필요하지 않지만 매우 흥미롭게 보이므로 여기에 관련이 있다고 생각되는 빠른 검색의 결과가 있습니다 (제목별로 판단하지 말고 초록을보십시오).

불행히도, 나는 적어도 IEEE Xplore 라이브러리를 통해서는 아니고,이 논문들 중 어느 것도 무료로 접근 할 수 없다고 생각합니다. 액세스 권한이 없으면 Google Scholar 를 통해 얻을 수 있으며 무료 종이 데이터베이스가 있습니다 ( 아직 IEEE 액세스 권한이 없을 때 Mendeley 데이터베이스를 다시 사용했습니다 ). 또한 논문의 초록 또는 임의 부분의 인터넷 검색 부분에서 일부 결과가 나오는 경우도 있습니다 (사전 완성 된 기사의 거의 완성 된 버전에서 우연히 발견 될 수 있음).

언급 된 논문을 찾는 데 사용한 검색어는 3D 이미지 , 깊이 이미지 , kinect 입니다. 처음 두 쿼리를 찾을 때 처리 를 중단 할 수도 있습니다 .

이것이 도움이되기를 바랍니다! 나는 더 이상 주제에 들어갈 수 없다고 생각합니다. 정말 흥미로운 소리입니다.



@mankoff는 요약본에서 추적에 집중하는 작업을 보았으며 기능 감지가 거의없는 직접 정보를 사용하는 데 집중하는 것 같습니다. 그러나 나는 단지 초록을 읽었으므로 확실하지 않습니다.

논문 제목을 검색하면 이러한 논문 중 일부에 대한 PDF를 찾을 수 있습니다. 또 다른 좋은 소스는 CiteSeer입니다 : citeseerx.ist.psu.edu/index 논문 목록에 감사드립니다!
Rethunk
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.