채워진 유리 물체 감지


10

이 질문에서 stackoverflow 로 보내졌습니다 . 질문이 너무 구체적이고 여기에 매너가 아닌 경우 실례합니다.)

임무 는 특정 액체가 들어있는 유리를 찾는 것입니다. 그림을 보여주고 내가 달성하려는 것과 내가 지금까지 달성하려고 한 것을 그림 아래의 설명에서 설명하겠습니다.

사진 : (사진과 링크를 게시하려면 10 명 이상의 평판이 필요하다고 생각하므로 링크는 다음을 수행해야합니다 : (그렇지 않으면 스택 오버플로 질문을 볼 수 있음)

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

자세한 설명 : opencv에서 특정 모양의 유리를 감지하는 알고리즘을 구현하려고했습니다 (유리는 다른 카메라 샷 각도 / 거리에 의해 변형 될 수 있음). 다른 모양의 다른 안경도 있습니다. 내가 찾고있는 유리에는 다른 색이 들어있는 안경과 구별되는 색의 액체가 채워져 있습니다.

지금까지 SIFT 기능 추출기를 사용하여 유리에서 일부 기능을 찾은 다음 유리가있는 다른 사진과 일치 시키려고했습니다.

이 접근법은 유리가 매우 특정한 위치에 있고 배경이 학습 이미지와 유사한 매우 구체적인 조건에서만 작동했습니다. 문제는 또한 유리가 3D 객체이며 그로부터 특징을 추출하는 방법을 모른다는 것입니다 (다른 각도에서 여러 사진이 어떻게 연결되어 있습니까?).

이제 다른 접근법을 사용할 수 있는지 모르겠습니다. 나는 이것에 대한 단서를 발견 했지만 (여기 https : //.com/questions/10168686/algorithm-improvement-for-coca-cola-can-shape-recognition#answer-10219338 ) 링크가 끊어진 것 같습니다.

또 다른 문제는 그러한 유리에서 다른 "빈 정도"를 감지하는 것이지만, 유리 자체를 제대로 찾을 수조차 없었습니다.

이 작업의 접근 방식에 대한 권장 사항은 무엇입니까? 로컬 3D 객체 기능을 찾는 데 다른 방법을 사용하는 것이 더 좋습니까? 아니면 다른 접근법을 함께 사용하는 것이 더 좋을까요? 여러 사진 세트에서 객체를 "학습"하는 알고리즘에 대해 들었지만 실제로는 본 적이 없습니다.

모든 조언은 정말 감사하겠습니다


C #에서 전체 소스 코드 샘플을 사용하는 최종 솔루션?
Kiquenet

와우, 그것은 매우 구체적인 요청입니다. 문제는 아직 해결책이 없으며 해결에 더 많은 시간을 투자하지 않을 것입니다. 나는 여기에 언급 된 논문으로 판단 할 때 제안 된 알고리즘의 정밀도가 매우 낮기 때문에 과학적 근거는 곧 해결책을 얻지 못할 것이라고 생각합니다. 어쨌든,이 프로젝트는 내 일을위한 것이기 때문에 나는 오늘날 작업이 비현실적이기 때문에 고객과의 타협에 대해 논쟁했다. "컵처럼 보이는 것은 무엇이든"에 대해 일반적인 하와 같은 특징 탐지기를 사용하고 맥주를 감지하기 위해 노란색 색조를 선택했습니다. 원래 작업이
아님

답변:



0

이 백서가 도움이 될 수 있습니다. http://ai.stanford.edu/~ang/papers/iros09-ScalableLearningObjectDetectionGPU.pdf

깊이 이미지를 얻기 위해 2D 이미지와 함께 액티브 스테레오 시스템을 사용하지만 패치 기반 기능을 사용하여 작은 조각으로 객체의 사전을 구성한 다음 분류기를 훈련시키는 방법에 흥미가 있습니다. 탐지 속도를 높이기 위해이 기능을 추가 할 수 있습니다.


나는이 작업이 야생의 실천에 잘 사용될 수 있다고 생각하지 않습니다. 논문에 설명 된 로봇은 깊이 정보를 감지하기 위해 깊이 센서가 필요합니다 ... 휴대폰 등에서 임의의 사진을 찍을 때 키 넥트를 운반하는 것은 실용적이지 않습니다 ...하지만 패치 기반 기능은 매우 흥미로운 접근 방식입니다!
user1916182

-1

안면 인식 소프트웨어와 관련하여 많은 작업이 수행되었습니다. 예를 들어 사진에 태그를 지정할 때 Facebook에서 알림을 받으면 얼굴의 위치가 상자로 표시되어 제안됩니다.

신경망을 사용하는 이미지에서 얼굴 인식에 대한 많은 문헌을 보았으며 빠른 Google 검색으로 의심 할 여지없이 해당 주제에 대한 많은 양의 정보가 나타납니다. 이러한 네트워크는 이미지의 픽셀을 입력으로 사용합니다. 귀하의 경우 불투명도 변경 / 빛이 유리에 반사되는 방식은 네트워크가 배우는 기능을 식별하는 것이 좋습니다.

한 가지 문제는 훈련 데이터로 사용해야하는 사진 수와 이러한 사진의 사전 처리 (즉, 얼굴 식별)입니다. 네트워크를 충분히 훈련시키기에 충분한 이미지로이 작업을 수행 할 수없는 경우 학습 단계에서 몇 가지 지름길을 찾아야합니다. 이 문서는 당신이하고 싶은 것과 관련이 있습니다 : http://www.ll.mit.edu/publications/journal/pdf/vol04_no2/4.2.5.neuralnetwork.pdf

운 좋게도 이것은 매우 활동적인 분야이며 이러한 유형의 문제에 필요한 많은 코드를 온라인에서 쉽게 사용할 수 있습니다.

이미지에서 안경을 식별 할 수 있으면 거기서부터 추가 분석을 수행 할 수 있습니다.


이것은 완전히 관련이 없습니다
user1916182

흥미 롭습니다. 어쨌든 여기에는 신경망을 기반으로 한 Facebook에서 사용하는 탐지 알고리즘에 대한 링크가 있습니다. 행운을 빕니다, github.com/facebookresearch/Detectron .
rwolst
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.