AI바라기의 인공지능

ASPP(Atrous Spatial Pyramid Pooling) 본문

딥러닝/컴퓨터비전

ASPP(Atrous Spatial Pyramid Pooling)

AI바라기 2023. 9. 25. 20:13

atrous pooling을 pyramid처럼 쌓는다는 느낌으로 받아들이면 될 것 같습니다. atrous convolution을 통해서 receptive field를 확대했다고 하면, ASPP에서는 다른 dilation rate를 가진 atrous pooling layer를 중첩하여 multi scale에 더 잘 반응할 수 있도록 한 것입니다.

 

 

 

ASPP(Atrous Spatial Pyramid Pooling)은 이미지 분류, 객체 탐지, 세그멘테이션 등 다양한 컴퓨터 비전 작업에서 사용되는 패치 피쳐맵을 위한 공간 피쳐맵 추출 기법입니다. ASPP는 다양한 크기의 필터와 비율을 사용하여 이미지의 다양한 스케일과 텍스처 정보를 추출합니다.

ASPP는 다음과 같은 4가지 모듈로 구성됩니다.

Atrous convolution: 다양한 크기의 필터와 비율을 사용하여 패치 피쳐맵을 컨볼루션합니다.
Spatial pyramid pooling: 다양한 크기의 풀링을 사용하여 패치 피쳐맵을 다운샘플링합니다.
Concatenation: 다양한 모듈의 출력을 연결합니다.
1x1 convolution: 연결된 출력을 1x1 컨볼루션으로 통과시켜 차원을 줄입니다.
ASPP는 다음과 같은 장점이 있습니다.

다양한 스케일과 텍스처 정보를 추출할 수 있습니다.
이미지의 세부 정보와 전체 정보를 모두 고려할 수 있습니다.
강력한 표현력을 제공합니다.
ASPP는 다음과 같은 방법으로 사용될 수 있습니다.

이미지 분류: 이미지의 다양한 스케일과 텍스처 정보를 사용하여 이미지의 클래스를 분류합니다.
객체 탐지: 이미지의 다양한 스케일과 텍스처 정보를 사용하여 객체를 감지합니다.
세그멘테이션: 이미지의 다양한 스케일과 텍스처 정보를 사용하여 이미지를 세그멘테이션합니다.
ASPP는 다음과 같은 연구에서 사용되었습니다.

DeepLab v3: ASPP를 사용하여 이미지 분류, 객체 탐지, 세그멘테이션 성능을 향상시켰습니다.
PSPNet: ASPP를 사용하여 이미지 세그멘테이션 성능을 향상시켰습니다.
DeepLab v4: ASPP를 사용하여 이미지 분류, 객체 탐지, 세그멘테이션 성능을 향상시켰습니다.
ASPP는 다양한 컴퓨터 비전 작업에서 강력한 표현력을 제공하는 효율적인 공간 피쳐맵 추출 기법입니다.