단일 신경망이 두 가지 유형의 객체 인식을 처리 할 수 ​​있습니까? 아니면 두 개의 작은 네트워크로 분할해야합니까?


9

특히, 리소스가 제한된 내장 컴퓨터는 교통 카메라의 라이브 비디오 스트림을 분석하여 차량 번호판 번호가 포함 된 좋은 프레임을 선택하려고합니다. 플레이트를 찾으면 프레임을 OCR 라이브러리로 넘겨 등록을 추출하고 추가로 사용합니다.

우리나라에서는 직사각형 (일반)과 정사각형의 두 가지 유형의 번호판이 일반적으로 사용되고 있습니다. 실제로는 다소 직사각형이지만 "너무 넓습니다".

(더 많은 유형이 있지만 무시하도록하겠습니다. 적은 비율이며 일반적으로 우리의 관심을 벗어난 차량에 속합니다.)

자원이 제한적이고 신속한 실시간 처리가 필요하기 때문에 시스템이 처리 할 수있는 네트워크의 최대 크기 (셀 수 및 연결 수)가 고정되어 있습니다.

이것을 두 개의 작은 네트워크로 나누는 것이 더 좋을까요? 각 네트워크는 한 가지 유형의 등록 판을 인식합니까, 아니면 더 큰 단일 네트워크가 두 가지 유형을 더 잘 처리합니까?

답변:


6

글쎄, 신경망에 어떤 유형의 기능을 제공하는지 모르겠습니다. 그러나 일반적으로 단일 신경망을 사용합니다. 네트워크 교육 리소스에는 제한이 없으며 네트워크를 적용하는 동안 유일한 문제는 리소스입니다.

문제는 아마도 두 가지 문제에 공통점이 있다는 것입니다 (예를 들어 두 유형의 플레이트는 직사각형입니다). 즉, 두 개의 네트워크를 사용하는 경우 각각 동일한 하위 문제 (공통 부분)를 다시 해결해야합니다. 하나의 네트워크 만 사용하는 경우 문제의 공통 부분에서 해결되는 셀 / 무게가 더 적게 걸리고 나머지 가중치 / 셀을 더 잘 인식 할 수 있습니다.

결국, 내가 당신의 자리에 있다면 나는 두 가지를 모두 시도 할 것입니다. 이것이 최선의 해결책이 무엇인지 확신 할 수있는 유일한 방법이라고 생각합니다. 이론적으로 말하면 몇 가지 요소를 포함하지 않을 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.