기술 용어의 오용에 대해 사과합니다. CNN (Convolutional Neural Network)을 통한 시맨틱 세그먼테이션 프로젝트를 진행하고 있습니다. Encoder-Decoder 유형의 아키텍처를 구현하려고 시도하므로 출력의 크기는 입력과 동일합니다.
라벨을 어떻게 디자인합니까? 어떤 손실 기능을 적용해야합니까? 특히 클래스 불균형이 심한 상황에서 (클래스 간 비율은 이미지마다 다름)
이 문제는 두 가지 클래스 (관심 대상 및 배경)를 처리합니다. tensorflow 백엔드와 함께 Keras를 사용하고 있습니다.
지금까지 픽셀 단위 라벨링을 적용하여 예상 출력을 입력 이미지와 동일한 크기로 디자인하려고합니다. 모델의 최종 레이어에는 소프트 맥스 활성화 (2 클래스) 또는 시그 모이 드 활성화 (픽셀이 객체 클래스에 속할 확률을 표현하기 위해)가 있습니다. 이러한 유형의 작업에 적합한 목적 함수를 설계하는 데 문제가 있습니다.
function(y_pred,y_true)
,
Keras 와 동의 합니다.
관련된 텐서의 치수 (모델의 입력 / 출력)를 구체적으로 지정하십시오. 모든 생각과 제안은 대단히 감사합니다. 감사합니다 !