목록2025/06/04 (1)
AI바라기의 인공지능

VR VIDEOREASONBENCH: MLLM의 Vision-Centric Complex Video Reasoning 능력 평가용어 설명 (Glossary)VIDEOREASONBENCH: 본 논문에서 제안하는 vision-centric complex video reasoning 능력을 평가하기 위한 새로운 benchmark.Vision-centric complex video reasoning: 단순한 객체 인식이나 활동 인식을 넘어, 영상 내 시각적 단서에 깊이 의존하여 여러 단계의 추론을 거쳐야 하는 복잡한 video 이해 작업.Latent state: Video 내에서 직접적으로 항상 관찰되지는 않지만, 일련의 operation을 통해 변화하는 숨겨진 상태 (예: 가려진 타일의 배열, 컵 속 동전 유..
논문리뷰
2025. 6. 4. 18:08