이미지 처리의 컨볼 루션 직관


9

이미지 처리에서 컨벌루션 에 대한 많은 문서를 읽었 으며 대부분은 수식, 추가 매개 변수에 대해 말합니다. 이미지에서 컨볼 루션을 수행하는 데있어 직관과 실제 의미를 설명하는 사람은 없습니다. 예를 들어, 그래프에서 유도의 직관은 예를 들어 더 선형 적입니다.

정의에 대한 빠른 요약은 이미지와 커널 사이에 컨볼 루션이 겹친 사각형을 곱한 후 다시 합산하여 앵커에 넣는 것입니다. 그리고 이것은 나에게 의미가 없습니다.

컨볼 루션에 관한이 기사에 따르면 컨볼 루션이 왜 "믿을 수없는"일을 할 수 있는지 상상할 수 없습니다. 예를 들어이 링크의 마지막 페이지에서 라인 및 에지 감지. 적절한 컨볼 루션 커널을 선택하면 좋은 효과를 얻을 수 있습니다 (라인 감지 또는 에지 감지).

누구나 어떻게 할 수 있는지에 대한 직관을 제공 할 수 있습니까 (정확한 증거 일 필요는 없습니다)?

답변:


13

Convolution을 생각하는 가장 간단한 방법은 주변 픽셀의 무게를 기준으로 픽셀 값을 새로운 값으로 변경하는 방법이라고 생각합니다.

Box Blur가 왜 쉬운 지 쉽게 알 수 있습니다.

_____________
|1/9|1/9|1/9|
|1/9|1/9|1/9|
|1/9|1/9|1/9|
-------------

공장. 이 커널을 발전시키는 것은 사진의 모든 픽셀을 통과하고 픽셀의 새로운 가치를 자체 평균과 8 개의 주변 픽셀로 만드는 것과 같습니다.

그것을 얻는다면 Gaussian Blur가 작동하는 이유를 알 수 있습니다.

_____________________
|.01|.04|.07|.04|.01|
|.04|.16|.26|.16|.04|
|.07|.26|.41|.26|.07|
|.04|.16|.26|.16|.04|
|.01|.04|.07|.04|.01|
---------------------

평균화가 더 가까운 픽셀에 더 강력하게 가중되는 것을 제외하고는 기본적으로 동일합니다. 멀어 질수록 무게가 얼마나 빨리 떨어지는 지 정의하는 함수는 Gaussian Function 이지만 블러 링에 사용하기 위해 함수의 세부 사항을 알 필요는 없습니다.

링크 된 기사 의 가장자리 감지 커널은 너무 오래 쳐다 보면 의미가 있습니다.

__________
|-1|-1|-1|
|-1|.8|-1|
|-1|-1|-1|
----------

기본적으로 모든 픽셀의 값은 원래 값의 8/9에서 시작한다고 말합니다. 그런 다음 주변의 모든 픽셀 값을 빼서 새 픽셀에 도달합니다.

따라서 픽셀 값이 높고 주변 픽셀 값이 높으면 서로 상쇄됩니다. 픽셀 값이 낮고 주변의 모든 픽셀도 낮 으면 서로 상쇄됩니다. 픽셀의 값이 높고 주변의 픽셀 값이 낮 으면 (물체 가장자리의 픽셀에서와 같이) 새 픽셀 값이 높아집니다.


6

컨벌루션 / 교차 상관에 대해 생각하는 한 가지 방법은 데이터에서 일부 신호를 검색하는 것과 같습니다. 데이터가 커널처럼 보일수록 결과 값이 높아집니다. 나는 실제로 상호 상관 관계에서와 같이 커널의 반대 방향을 취하지 만 기본적으로 동일합니다.

예를 들어, 1d 데이터에서 방향 단계를 찾고 있다고 가정 해 봅시다.

커널은

[-1 1]

데이터에 적용하겠습니다

[2 2 2 2 2 1 1 1 1 1]

결과는

[0 0 0 0 0 1 0 0 0 0]

단계의 위치를 ​​감지합니다. 더 큰 단계는 더 큰 가치를 줄 것입니다.

커널에 나타나는 패턴에 패턴을 곱하면 값이 높아지기 때문에 효과가 있습니다.

에지 감지 (또는 다른 패턴 감지)는 커널과 같은 방식으로 작동합니다.

[-1 2 -1]

이렇게하면 더 높은 차원으로 확장 할 수도 있습니다.

이것은 당신에게 컨볼 루션 이미지 프로세싱의 일부 응용에 대해 직관을 제공해야합니다.


4

컨볼 루션을 이해하기가 너무 어렵다고 생각되면 이미지 처리에 적용된 수학적 모폴로지에 대한 검색을 시작하는 것이 좋습니다. 수학적 모폴로지의 기본 아이디어는 컨볼 루션에 매우 가까운 작업을 수행하여 이미지의 형태학이지만 토폴로지 정보를 유지합니다.이 방법으로 서있는 인간의 이미지를 만들 수 있습니다.이 골격은 인간과 거의 비슷합니다. 침식 작업을 적용한 다음 작업을 확장 한 다음 열기로 이동하십시오. / 닫기 작업을 수행하면 이미지의 모든 픽셀에 적용 할 수있는 마스크와 큰 시나리오에서 마스크를 사용하여 훌륭한 결과를 얻는 방법 (마지막 침식을 사용하여 무언가를 시작할 지점 찾기)을 한 번 이해하기 시작합니다. 당신은 수학적 형태를 이해하고, 컨볼 루션은 조금 더 어렵습니다.미적분학을 기반으로하고 통합 후에 정의되었지만 여전히 흐림, 가우시안 블러, 샤프닝, 에지 감지, 라플라스, 그라디언트 등 많은 컨벌루션을 이해하기 쉽습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.