목록2026/03/09 (2)
AI바라기의 인공지능
📖 용어 설명 (Terminology) Semantic segmentation: 이미지 내의 모든 픽셀이 어떤 클래스에 속하는지 분류하여 분할하는 작업. FCNNs (Fully Convolutional Neural Networks): 3D 의료 이미지 segmentation의 기존 표준 아키텍처지만, 제한된 필터(kernel) 크기로 인해 멀리 떨어진 픽셀 간의 관계를 파악하는 데 한계가 있음. Swin Transformer: 이미지를 여러 패치로 나누고, 이 패치들의 묶음인 윈도우를 이동(shifted windows)시키며 self-attention을 연산하여 효율성과 다중 스케일(multi-scale) 특징 추출을 모두 잡은 아키텍처. BraTS (Multi-modal Brain Tumor Seg..
주요 용어 설명 (Terminology) FiLM (Feature-wise Linear Modulation): 모델의 중간 feature map에 대해 외부 조건(질문 등)을 기반으로 affine transformation을 수행하여 활성화 정도를 조절하는 범용적인 conditioning 기법입니다.Affine transformation: 값을 스케일링(곱하기)하고 시프팅(더하기)하는 선형 변환입니다. 이 논문에서는 모델의 특징을 조절하는 gamma(스케일링)와 beta(시프팅) 파라미터로 작동합니다. Visual reasoning: 단순 객체 인식을 넘어, 이미지 내 객체들의 관계를 파악하고 복잡한 조건의 질문에 대해 다단계 논리적 추론을 통해 답을 도출하는 과정입니다. Conditioning: 하나의..
