내 이해는 회선 신경망의 회선 레이어는 input_channels, filter_height, filter_width, number_of_filters의 네 가지 차원을 가지고 있다는 것입니다. 또한 각각의 새로운 필터가 모든 input_channels (또는 이전 레이어의 기능 / 활성화 맵)에 대해 복잡하다는 것을 이해합니다. 그러나 CS231의 아래 그림은 채널 전체에서 사용되는 동일한 필터가 아니라 단일 채널에 적용되는 각 필터 (빨간색)를 보여줍니다. …
Convolutional Neural Network를 사용하여 기존 이미지가없는 문제 영역 (예 : 추상 데이터를 그래픽으로 표현)에서 패턴 인식에 사용할 수 있습니까? 항상 덜 효율적입니까? 이 개발자 는 현재의 개발이 더 진행될 수 있지만 이미지 인식에 한계가 없다면 불가능하다고 말합니다.
CNN에서 사용하려면 2400 x 2400 크기의 10K 이미지가 필요하다고 가정 해 봅시다. 이제 문제는 다운 샘플링 권한이없는 큰 이미지 크기를 처리하는 방법입니다. 시스템 요구 사항은 다음과 같습니다. 우분투 16.04 64 비트 RAM 16GB GPU 8GB HDD 500GB 1) 훈련해야 할 큰 이미지를 처리하는 기술이 있습니까? 2) 사용하기에 적당한 배치 크기는 …
위조 사진, 위조 사운드 비트 및 위조 비디오를 저렴하게 만들 수있는 기능이 커짐에 따라 실제 내용과 그렇지 않은 부분을 인식하는 데 점점 더 많은 문제가 발생합니다. 지금도 적은 비용으로 가짜 미디어를 만드는 많은 응용 프로그램 예를 볼 수 있습니다 ( Deepfake , FaceApp 등 참조). 분명히, 이러한 응용 프로그램이 잘못된 …
시각적 난독 화 방법으로 AI 를 쉽게 속일 수있는 텍스트 보안 문자 (따라서 올바른 텍스트를 입력해야 함) 과제를 생성하는 현대 기술이 있습니까? 예를 들어 이미지에 포함 된 텍스트 를 인식하고 (플래시 또는 자바와 같은 외부 플러그인을 고려하지 않고) 이미지 분류 등을 작성하는 일반 기능에 대해 이야기하고 있습니다. 노이즈, 그라디언트, 회전 …
나는 심층 신경망이 비교적 쉽게 바보 ( 링크 )되어 신뢰 주제에서 완전히 (또는 적어도 대부분) 합성 / 인공 이미지를 인식하는 데 높은 신뢰를 줄 수 있음을 읽었습니다 . 개인적으로, 나는 합성 / 인공 이미지에 대해 높은 신뢰를주는 DNN의 큰 문제는 보이지 않지만, 화이트 노이즈 ( link )에 대한 높은 신뢰도 …
특히, 리소스가 제한된 내장 컴퓨터는 교통 카메라의 라이브 비디오 스트림을 분석하여 차량 번호판 번호가 포함 된 좋은 프레임을 선택하려고합니다. 플레이트를 찾으면 프레임을 OCR 라이브러리로 넘겨 등록을 추출하고 추가로 사용합니다. 우리나라에서는 직사각형 (일반)과 정사각형의 두 가지 유형의 번호판이 일반적으로 사용되고 있습니다. 실제로는 다소 직사각형이지만 "너무 넓습니다". (더 많은 유형이 있지만 무시하도록하겠습니다. …