픽셀 기반 분류와 관련하여 문제가 없습니다. 각 픽셀은 n 차원 벡터이며 Support Vector Machines, MLE, knn 분류기 등을 사용하는지 여부에 따라 일부 메트릭에 따라 클래스에 할당됩니다.
그러나 지역 기반 분류 기준에 관한 한, 지난 몇 년 동안 GPU, 방대한 양의 데이터, 클라우드 및 광범위한 오픈 소스 알고리즘 덕분에 광범위한 알고리즘의 조합으로 인해 엄청난 발전이있었습니다. github에 의해). 컴퓨터 비전 / 분류에서 가장 큰 발전 중 하나는 CNN (Convolutional Neural Network)입니다.. 컨볼 루션 레이어는 기존 픽셀 기반 분류기와 같이 색상을 기반으로 할 수있는 기능을 "학습"할뿐만 아니라 에지 검출기와 픽셀 영역 (따라서 컨볼 루션 부분)에 존재할 수있는 모든 종류의 기능 추출기를 생성합니다. 픽셀 기반 분류에서 추출 할 수 없습니다. 즉, 다른 유형의 픽셀 영역 중간에있는 픽셀을 잘못 분류 할 가능성이 적습니다. 분류를 실행하고 아마존 중간에 얼음을 넣은 경우이 문제를 이해할 수 있습니다.
그런 다음 컨볼 루션을 통해 학습 한 "기능"에 완전히 연결된 신경망을 적용하여 실제로 분류를 수행합니다. CNN의 다른 큰 장점 중 하나는 일반적으로 회선 및 분류 계층 사이에 중간 계층이 있으므로 풀링 및 드롭 아웃을 사용하여 오버 피팅을 피하고 주변 문제를 해결하는 중간 계층이 있기 때문에 CNN이 스케일 및 회전이 변하지 않는다는 것입니다 규모와 방향.
이 분야의 개척자 중 한 명인 Andrei Karpathy의 Standord 수업이어야 하며, 전체 강의 시리즈는 YouTube에서 구할 수 있지만 convolutional neural network에 대한 수많은 리소스 가 있습니다 .
물론, 픽셀 대 영역 기반 분류를 처리하는 다른 방법이 있지만, 이것은 현재 최첨단의 접근법이며, 기계 번역 및 자율 주행 자동차와 같은 원격 감지 분류를 넘어서는 많은 응용 분야를 가지고 있습니다.
다음은 TensorFlow 설정 및 AWS 실행 지침을 포함하여 태그가있는 교육 데이터에 Open Street Map을 사용 하는 지역 기반 분류 의 또 다른 예입니다 .
다음은 에지 감지를 기반으로 한 분류기의 Google 어스 엔진을 사용하는 예입니다.이 경우 가우시안 커널 및 회선을 사용하지만 피벗 관개를 사용하지만 지역 / 에지 기반 접근 방식의 힘을 보여줍니다.
픽셀 기반 분류에 비해 객체의 우수성이 상당히 널리 받아 들여지고 있지만 여기 에 객체 기반 분류 의 성능을 평가하는 Remote Sensing Letters 의 흥미로운 기사가 있습니다.
마지막으로, 흥미로운 예는, 지역 / 컨볼 루션 기반 분류기를 사용하더라도 컴퓨터 비전은 여전히 매우 어렵다는 것을 보여줍니다. 다행히도 Google, Facebook 등의 가장 똑똑한 사람들은 알고리즘을 연구하여 개, 고양이 및 다른 유형의 개와 고양이. 따라서 원격 감지에 관심이있는 사용자는 밤에 쉽게 잠을 잘 수 있습니다. : D