'2025/12/18 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/12 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록2025/12/18 (1)

AI바라기의 인공지능

VLM : 논문 리뷰 : VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

용어 설명 (Terminology)VisionThink: 저자들이 제안한 새로운 VLM 패러다임. 저해상도 이미지로 먼저 추론을 시도하고, 불충분할 경우 고해상도 이미지를 요청하는 방식.General VQA (General Visual Question Answering): 정해진 정답이 있는 수학 문제뿐만 아니라, 자연어 설명이나 주관적 해석이 필요한 일반적인 시각적 질의응답 태스크.LLM-as-Judge: 강화 학습(RL)의 보상(Reward)을 계산할 때, 정답과의 단순 문자열 매칭 대신 거대 언어 모델(LLM)을 심판(Judge)으로 사용하여 의미론적 정확성을 판단하는 전략.GRPO (Group Relative Policy Optimization): Critic 모델 없이 그룹 내 출력들의 상대적 ..

논문리뷰 2025. 12. 18. 13:28

이전 Prev 1 Next 다음

목록2025/12/18 (1)

AI바라기의 인공지능

티스토리툴바