목록2026/03/16 (3)
AI바라기의 인공지능
LayerNorm이란 레이어에 들어온 입력 데이터의 스케일을 조정하는 방법이다. 입력 데이터의 평균과 표준편차를 구한 뒤 정규화를 진행한다. 이때 평균: 입력 데이터의 모든 feature들의 평균 표준편차: 입력 데이터의 모든 feature들의 표준편차 이다. 그 후 정규화된 $x$에 학습 가능한 감마($\gamma$)를 곱하고 베타($\beta$)를 더해, 정규화로 너무 빡빡해진 표현을 다시 조절할 수 있게 만든다. $$\mu=\frac{1}{H}\sum_{i=1}^{H}x_i$$ $$\sigma^2=\frac{1}{H}\sum_{i=1}^{H}(x_i-\mu)^2$$ $$\hat{x}_i=\frac{x_i-\mu}{\sqrt{\sigma^2+\epsilon}}$$ $$y_i=\gamma\hat{x}_..
용어 설명World model: Agent가 행동하기 전 미래 상태를 내부적으로 시뮬레이션하여 의사결정 및 planning을 돕는 신경망 모델.Decision-time planning: Test-time에 학습된 world model을 사용하여 목표 상태에 도달하기 위한 최적의 action sequence를 탐색하는 과정 (예: MPC 적용).CompACT: 이 논문에서 제안한 핵심 모델인 초압축 이산형 토크나이저 (Compact Discrete Tokenizer). 이미지를 단 8개 또는 16개의 토큰으로 압축함.Latent Resampler: Frozen pre-trained vision model (DINOv3)의 특징으로부터 의미론적(semantic) 정보만 추출하여 소수의 토큰으로 압축 매핑하는..
용어 설명Latent Planning: Raw pixel(이미지) 상태가 아닌, 데이터를 압축한 추상적인 embedding space(잠재 공간) 내에서 미래의 상태를 예측하고 최적의 action을 찾는 방법론.Temporal Straightening: 이 논문의 핵심 제안 기법. World model이 학습할 때, 시간에 따른 상태 변화(trajectory)가 잠재 공간 내에서 굽지 않고 최대한 '직선(straight)'으로 뻗어나가도록 강제하는 정규화(regularization) 기법.Geodesic distance: 장애물을 피해서 실제로 이동해야 하는 최단 경로 거리. (단순한 두 점 사이의 직선거리인 Euclidean distance와 대비됨).Latent trajectory curvature:..
