목록2026/03/06 (2)
AI바라기의 인공지능
용어 설명DLM (Diffusion Language Model): 텍스트 생성 과정에 이미지 생성 등에서 쓰이는 diffusion 알고리즘을 도입한 언어 모델.MDLM (Masked Diffusion): 토큰을 점진적으로 mask 토큰으로 덮은 뒤(absorbing-state), 이를 다시 예측하며 노이즈를 제거해 나가는 방식의 DLM.BD3LM (Block Diffusion): 시퀀스를 여러 block으로 나누고, 이전 block의 KV cache를 재사용하면서 현재 block 내의 토큰들은 diffusion을 통해 병렬로 생성하는 효율적인 하이브리드 모델.ARLM (Autoregressive Language Model): 전통적인 방식으로, 단어를 앞에서부터 순차적으로 예측하며 텍스트를 생성하는 언어..
TerminologyLRMs (Large Reasoning Models): 복잡한 추론 문제를 해결하기 위해 고안된 대규모 모델을 뜻합니다.RLVR (Reinforcement Learning from Verifiable Rewards): 모델이 내놓은 답변의 최종 정답 여부(Rule-based)만으로 보상을 주어 모델을 강화하는 학습 방식입니다.RFCS (Ratio of the First Correct Step): 정답이 처음 도출된 단계가 전체 추론 과정 중 어느 지점인지를 나타내는 지표로, 낮을수록 불필요한 사족이 많음을 의미합니다.SAGE (Self-Aware Guided Efficient Reasoning): 모델 내부의 확신도를 추적하여, 가장 효율적이고 정확한 추론 경로를 스스로 선택하게 만드..
