'2026/01/12 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2026/01 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록2026/01/12 (3)

AI바라기의 인공지능

VLM : 빠른 논문 리뷰 : Self-supervised Learning of Echocardiographic Video Representations via Online Cluster Distillation

용어 설명 (Terminology)Echocardiography (심초음파): 초음파를 이용해 심장의 구조와 움직임을 실시간으로 관찰하는 의료 영상 기술. 노이즈(speckle)가 많고 프레임 간 유사도가 매우 높아 일반적인 비디오 분석보다 어렵습니다.Self-supervised Learning (SSL, 자기지도학습): 사람이 직접 레이블(정답)을 달지 않고, 데이터 자체의 구조(예: 가려진 부분 맞추기)를 통해 모델이 스스로 특징을 학습하는 방법입니다.Masked Video Modeling (MVM): 비디오의 일부 영역(tubelets)을 마스킹하여 가리고, 모델이 가려진 부분을 복원하도록 훈련시킴으로써 시공간적 특징을 학습하게 하는 기법입니다.Distillation (지식 증류): 'Teacher..

논문리뷰 2026. 1. 12. 17:10

VLM : 빠른 논문 리뷰 : Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment

Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment 학습 노트1. Terminology Explanation (용어 설명)이 논문을 이해하기 위해 필요한 핵심 용어 정리입니다.SISR (Single-Image Super-Resolution): 저해상도 이미지 한 장을 입력받아 고해상도 이미지를 복원하는 기술입니다.Scale Autoregression: 픽셀 단위가 아닌 배율(Scale) 단위로 이미지를 순차적으로 생성하는 방식입니다. 한 번에 목표 해상도로 가는 것이 아니라, 중간 해상도 단계를 거쳐 점진적으로 확대합니다.AR-2 Modeling (Autoregressive-2): 현재 상태를 생..

논문리뷰 2026. 1. 12. 13:15

LLM : 빠른 논문 리뷰 : GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

TerminologyMulti-reward RL: 하나의 모델이 정확도(accuracy), 포맷 준수(format), 길이 제한(length constraint) 등 서로 다른 여러 목표를 동시에 만족하도록 학습하는 강화학습(Reinforcement Learning) 설정.GRPO (Group Relative Policy Optimization): Value Model 없이, 샘플링된 그룹 내에서 상대적인 이득(advantage)을 계산하여 Policy를 업데이트하는 효율적인 RL 알고리즘.Reward Collapse: 이 논문에서 규명한 GRPO의 문제점. 서로 다른 보상 조합(예: A는 성공, B는 실패 vs A는 실패, B는 대성공)이 정규화(normalization) 과정을 거치면 동일한 adva..

논문리뷰 2026. 1. 12. 12:18

이전 Prev 1 Next 다음

목록2026/01/12 (3)

AI바라기의 인공지능

티스토리툴바