신경망의 아이디어는 무거운 학습이 기능 학습을 담당하는 알고리즘에 의해 수행되므로 사전 처리가 거의 필요 없다는 것입니다.
Data Science Bowl 2015의 우승자는 접근 방식에 대한 글을 많이 작성 했으므로이 답변 내용의 대부분은 다음 과 같습니다
. 심층 신경망으로 플랑크톤 분류 . 특히 전처리 및 데이터 기능 보강에 대한 부분을 읽어 보시기 바랍니다 .
-이미지 크기 조정
다른 크기, 해상도 또는 거리에 대해서는 다음을 수행 할 수 있습니다. 각 이미지의 가장 큰면을 고정 길이로 간단히 조정할 수 있습니다.
또 다른 옵션은 openCV 또는 scipy를 사용하는 것입니다. 그러면 100 열 (너비)과 50 행 (높이)을 갖도록 이미지 크기가 조정됩니다.
resized_image = cv2.resize(image, (100, 50))
또 다른 옵션은 다음을 사용하여 scipy 모듈을 사용하는 것입니다.
small = scipy.misc.imresize(image, 0.5)
-데이터 보강
데이터 보강은 데이터 집합에 따라 다르지만 항상 성능을 향상시킵니다. 인위적으로 데이터 집합의 크기를 늘리기 위해 데이터를 보강하려는 경우 사례가 적용되는 경우 다음을 수행 할 수 있습니다 (예를 들어 주택이나 사람들의 이미지가 180도 회전하면 모든 정보가 손실되는 경우에는 적용되지 않음) 그러나 거울처럼 뒤집어 놓지 않으면)
- 회전 : 각도가 0 ° ~ 360 ° 인 임의 (균일)
- 번역 : -10에서 10 픽셀 사이의 이동으로 임의 (균일)
- 크기 조정 : 1 / 1.6과 1.6 사이의 배율 (임의)
- 뒤집기 : 예 또는 아니오 (베르누이)
- 전단 : -20 °와 20 ° 사이의 각도로 임의 (균일)
- 스트레칭 : 1 / 1.3과 1.3 사이의 신축 계수를 갖는 랜덤 (로그-균일)
Data Science 보울 이미지에서 결과를 볼 수 있습니다.
전처리 된 이미지
동일한 이미지의 증강 버전
다른 기술
이것들은 조명과 같은 다른 이미지 속성을 다루며 이미 간단한 전처리 단계와 같은 주요 알고리즘과 관련이 있습니다. UFLDL Tutorial 에서 전체 목록을 확인하십시오.