로고 감지를 위해 AI 또는 신경망 사용


10

비디오 파일 내부의 TV 채널 로고를 감지하려고하므로 입력 .mp4비디오가 주어지면 특정 프레임, 즉 첫 번째 프레임에 해당 로고가 있는지 여부를 감지하십시오.

로고는 사전에 동일하지만 크기가 100 % 같지는 않지만 위치는 항상 고정되어 있습니다.

이미 패턴 일치 기반 접근 방식이 있습니다. 그러나 패턴 크기가 100 % 같아야합니다. 이를 달성하기 위해 딥 러닝 및 신경망을 사용하고 싶습니다. 어떻게해야합니까? CNN의 효율성이 더 높다고 생각합니까?


1
AI에 오신 것을 환영합니다! 좋은 주제.
DukeZhou

1
@DukeZhou Tnx! 일부 샘플 코드에 대한 포인터로 적절한 대답을 얻길 바랍니다.
Tina J

답변:


5

이미지 인식을 수행하려면 특정 기능이있는 이미지를 나타내는 방법을 찾아야합니다.

좋은 이미지 인식 알고리즘의 정의 특성 중 하나는 두드러진 영역, 즉 가장 많은 정보를 포함하는 영역을 감지하는 기능입니다

현재 컨텐츠 기반 이미지 분류를위한 딥 러닝에 많은 관심이 있습니다. 각 레이어가 하나 이상의 이미지 기능을 추출하는 CNN 레이어가 3 개 이상인 딥 러닝을 구현하면 적절한 결과를 얻을 수 있습니다.


감사. 나는 CNN 사람이 아닙니다. 그러나 로고 이미지가 제공된 소스 코드에 대한 포인터가 있습니까, 로고가 있는지 감지 할 수 있습니까?
Tina J

3
안녕하세요, Satoj Kovic의 Github에서 DeepLogo를 확인하십시오. Python으로 작성되었으며 CNN을 사용하여 브랜드 로고를 인식합니다. 아래 링크를 게시했습니다. 건배. github.com/satojkovic/DeepLogo
세스 심바

3

비디오 입력이고 로고는 일반적으로 하드웨어 나 소프트웨어에 의해 라이브 또는 녹화 된 프레임에 걸쳐 있기 때문에 정지되어 있기 때문에 작업이 어렵지 않습니다. 로고에는 일반적으로 제한된 색상 팔레트와 선명한 가장자리가 있습니다. 단어 나 머리 글자를 철자 할 때 글꼴의 기능은 일반적으로 일관성이 있습니다. 이들은 딥 러닝에서 활용할 수있는 일반 사항입니다.

이 저자가 게시 한 다른 유사한 질문과 마찬가지로 LSTM과 CNN 레이어를 조합하여 로고를 찾아 격리 할 수 ​​있습니다. 일부 이미지 트릭을 사용하면 유사한 학습 기술 세트를 통해 로고 뒤의 이미지를 로고 주변의 픽셀에서 정확하고 신뢰성있게 재구성 할 수 있습니다.

이것들은 개발을위한 몇 가지 출발점입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.