객체 감지, 의미 론적 분할 및 로컬라이제이션의 차이점은 무엇입니까?


23

나는 그 단어들을 꽤 많은 출판물에서 읽었으며 객체 탐지와 의미 론적 세그먼테이션 vs 로컬라이제이션의 차이점이 무엇인지 분명히하는 용어에 대한 좋은 정의를 갖고 싶습니다. 정의를위한 소스를 제공 할 수 있다면 좋을 것입니다.


1
여기에서 슬라이드를 확인하십시오 : -cs231n.stanford.edu/slides/2017/cs231n_2017_lecture11.pdf
Shatu

답변:


18

객체 감지, 객체 인식, 객체 분할, 이미지 분할 및 시맨틱 이미지 분할에 대한 많은 논문을 읽었으며 사실이 아닌 결론은 다음과 같습니다.

객체 인식 : 주어진 이미지에서 모든 객체 (제한된 객체 클래스는 데이터 세트에 따라 다름)를 감지하고 경계 상자로 현지화하고 해당 경계 상자에 레이블을 레이블로 지정해야합니다. 아래 이미지에서 최첨단 물체 인식의 간단한 출력을 볼 수 있습니다.

객체 인식

객체 감지 : 객체 인식과 비슷하지만이 작업에서는 객체 경계 상자와 객체가 아닌 경계 상자를 의미하는 두 가지 종류의 객체 분류 만 있습니다. 예를 들어 자동차 감지 : 경계 상자를 사용하여 지정된 이미지의 모든 자동차를 감지해야합니다.

물체 감지

객체 분할 : 객체 인식과 마찬가지로 이미지의 모든 객체를 인식하지만 출력에는 이미지의 픽셀을 분류하는이 객체가 표시되어야합니다.

객체 세분화

이미지 세분화 : 이미지 세분화에서는 이미지의 영역을 세분화합니다. 출력물은 서로 일치하는 이미지의 세그먼트와 영역에 동일한 세그먼트에 있어야하는 레이블을 지정하지 않습니다. 이미지에서 수퍼 픽셀을 추출하는 것이이 작업 또는 전경 배경 분할의 예입니다.

이미지 분할

시맨틱 세그먼테이션 : 시맨틱 세그먼테이션에서 각 픽셀에 객체 클래스 (Car, Person, Dog, ...) 및 비 객체 (Water, Sky, Road, ...)로 레이블을 지정해야합니다. 다시 말해서 시맨틱 세분화에서 이미지의 각 영역에 레이블을 지정합니다.

시맨틱 세그먼테이션


좋은 대답입니다. 내가 그주의 할 것이다 cs231n.stanford.edu/slides/winter1516_lecture8.pdf의 이 하나 허용 정의인지 아닌지 슬라이드 8 개에서 사용하는 것과 동일한 클래스 내에서 여러 클래스와 여러 인스턴스를 감지 물체 검출의 다른 정의를 (나도 몰라, 모호함으로 인해 발생할 수 있습니다).
Keith

1
시맨틱 세그먼테이션과 같은 인스턴스 세그먼테이션이지만 소를 분리 된 것으로 분류해야합니다.
titus

2
첫 코멘트에서 슬라이드가 지금 여기에 있습니다 : - cs231n.stanford.edu/slides/2017/cs231n_2017_lecture11.pdf
Shatu

5

2019 년에도이 문제는 아직 명확하지 않으며 새로운 ML-Learner가 선택하는 데 도움이 될 수 있으므로 다음은 그 차이점을 보여주는 매우 좋은 이미지입니다.

(지역화는 이미지 분류가 완료된 후 "양"클래스 주변의 경계 상자입니다.) 출처 : https://towardsdatascience.com/detection-and-segmentation-through-convnets-47aa42de27ea source : Towardsdatascience.com


3

"지역화"는 "단일 객체 분류 + 2D 또는 3D 경계 상자를 사용한 지역화"를 의미한다고 생각합니다.

"객체 탐지"는 알려진 객체 클래스의 모든 인스턴스를 지역화하고 분류하는 것입니다.

시맨틱 세그먼테이션은 기본적으로 픽셀 별 분류입니다.

또한 wrt 관련 측정 항목 (출처 : https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/ )

정밀도는 예측 된 총 물체 수에 대해 정확하게 식별 된 물체의 비율입니다 (진 양성 대 진 양성 + 가양 성 비율).

리콜은 이미지에서 실제 객체의 총 수에 대해 정확하게 식별 된 객체의 비율입니다 (진 양성 대 진 양성 + 진 음성의 비율).

mAP : 정밀도와 리콜의 리콜을 기반으로 단순화 된 평균 평균 정밀도 점수. 네트워크가 관심 객체에 얼마나 민감하고 허위 경보를 얼마나 잘 피하는 지에 대한 좋은 결합 측정입니다.


2

현지화라는 용어는 명확하지 않습니다. 그러므로 객체 탐지 ​​및 의미 론적 분할이라는 용어를 논의 할 것입니다.

물체 검출에서, 각각의 이미지 픽셀은 그것이 특정 클래스 (예를 들어, 얼굴)에 속하는지 여부에 따라 분류된다. 실제로, 이것은 경계 상자를 형성하기 위해 픽셀을 그룹화함으로써 단순화되므로, 경계 상자가 물체 주위에 밀착되는지를 결정하는 문제를 감소시킨다. 픽셀은 여러 개체 (예 : 얼굴, 눈)에 속할 수 있으므로 여러 레이블을 동시에 보유 할 수 있습니다.

한편, 시맨틱 세그먼테이션은 각 이미지 픽셀에 클래스 레이블을 할당하는 것을 포함한다. 바운딩 박스 단순화를 포함하지 않기 때문에 더 나은 지역화 정확도를 허용하지만 픽셀 당 하나의 레이블을 엄격하게 적용합니다.


-2

시맨틱 분할 : 동일한 객체 클래스에 속하는 이미지의 일부를 함께 클러스터링하는 작업입니다. 예 : 도로 표지판 감지


2
그러나 도로 표지판 감지는 물체 감지입니다. 차이점을 설명해 주시겠습니까?
reinierpost
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.