목록2026/05/16 (1)
AI바라기의 인공지능
Planning : 빠른 논문 리뷰 : Temporal Logic Specification-Conditioned Decision Transformer for Offline Safe Reinforcement Learning
TerminologySTL (Signal Temporal Logic): 실시간 신호의 시간적/논리적 속성(예: "A 이후에 반드시 B를 수행하라")을 명시하기 위한 정형 언어.Robustness Value (rho): STL 명세(Specification)가 얼마나 잘 준수되었는지를 나타내는 정량적 지표. 양수면 만족, 음수면 위반을 의미하며 절대값은 그 정도를 나타냄.Quantitative Semantics: STL의 특징으로, 단순히 참/거짓을 따지는 것이 아니라 "얼마나" 만족했는지를 수치로 계산하는 체계.Prefix Robustness Value: 현재 시점 t까지의 궤적(Trajectory)이 STL 명세를 얼마나 만족했는지에 대한 과거의 성적표.Suffix Robustness Value: 현재..
논문리뷰
2026. 5. 16. 17:42
