목록2026/03/13 (2)
AI바라기의 인공지능
용어 설명MBRL (Model-Based Reinforcement Learning): 환경의 동작 방식(dynamics)을 모방하는 world model을 먼저 학습하고, 이 모델 안에서 가상으로 미래를 상상(imagination)하여 policy를 훈련하는 강화학습 기법.World model: agent가 경험을 바탕으로 환경의 상태 전이(state transition)와 보상을 예측하도록 학습된 내부 표현 모델.Decoder-free: 픽셀 단위의 이미지를 다시 그려내는(reconstruction) pixel decoder를 사용하지 않고, 잠재 공간(latent space)에서 직접 모델을 학습시키는 구조.Next-embedding prediction: 현재 상태가 아닌 '다음 시점'의 observ..
용어 설명Navigation World Model(NWM): 에이전트의 과거 시각적 관측치와 내비게이션 action을 바탕으로 미래의 시각적 상태를 예측하고 생성해 내는 controllable video generation model입니다.Conditional Diffusion Transformer(CDiT): 모델의 연산 복잡도를 줄이기 위해 이 논문에서 고안한 독창적인 아키텍처입니다. Target frame의 token에만 attention 연산을 집중하고 과거 frame은 cross-attention으로 처리하여 연산 복잡도를 선형(linear)으로 낮춥니다.Model Predictive Control(MPC): 현재 상태에서 목표를 달성하기 위한 최적의 행동 순서를 찾기 위해, NWM을 활용하여 ..
