목록2025/12/19 (2)
AI바라기의 인공지능
용어 설명 (Terminology)VLMs (Vision-Language Models): 이미지와 텍스트를 모두 이해하고 처리할 수 있는 인공지능 모델 (예: GPT-4o, Gemini, LLaVA).Color Perception: 입력된 이미지에서 색상을 정확하게 감지하고 해석하는 기초적인 시각 능력.Color Reasoning: 색상 정보를 단서로 삼아 사전 지식과 결합하여 논리적인 결론을 도출하는 능력 (예: 색상 비교, 색상 기반 물체 카운팅).Color Robustness: 이미지의 색상이 변경(recoloring)되었을 때도 모델이 일관된 정답을 내놓을 수 있는지 평가하는 척도.HSV Color Space: 색상(Hue), 채도(Saturation), 명도(Value)로 구성된 색 공간. 이 ..
TerminologiesOpen-Vocabulary Scene Graph Generation (OVSGG): 학습 데이터에 존재하지 않는 새로운 객체(Novel Object)나 관계(Novel Relation)까지 인식하여 이미지 내의 구조적 의미(Scene Graph)를 생성하는 과제.Knowledge Infusion & Transfer: VLM 기반 OVSGG의 일반적인 2단계 파이프라인. 대규모 데이터셋으로 VLM을 Pre-training하여 지식을 주입(Infusion)하고, Task-specific 데이터셋으로 Fine-tuning하여 지식을 전이(Transfer)하는 과정.Pseudo-supervision: Region-level annotation(bbox 등)이 부족한 데이터에서 캡션 등을..