목록2025/12/18 (1)
AI바라기의 인공지능
VLM : 논문 리뷰 : VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning
용어 설명 (Terminology)VisionThink: 저자들이 제안한 새로운 VLM 패러다임. 저해상도 이미지로 먼저 추론을 시도하고, 불충분할 경우 고해상도 이미지를 요청하는 방식.General VQA (General Visual Question Answering): 정해진 정답이 있는 수학 문제뿐만 아니라, 자연어 설명이나 주관적 해석이 필요한 일반적인 시각적 질의응답 태스크.LLM-as-Judge: 강화 학습(RL)의 보상(Reward)을 계산할 때, 정답과의 단순 문자열 매칭 대신 거대 언어 모델(LLM)을 심판(Judge)으로 사용하여 의미론적 정확성을 판단하는 전략.GRPO (Group Relative Policy Optimization): Critic 모델 없이 그룹 내 출력들의 상대적 ..
논문리뷰
2025. 12. 18. 13:28