목록2025/06/24 (1)
AI바라기의 인공지능
Benchmark : 논문리뷰 : Video-MME: The First-Ever Comprehensive Evaluation Benchmarkof Multi-modal LLMs in Video Analysis
쉬운 설명이 논문은 "정적인 그림(사진)만 보고 대답하는 AI"를 넘어서, "움직이는 그림(비디오)을 보고 대답하는 AI"의 능력을 정확하게 평가하기 위한 새로운 '종합 시험지'를 만들었다고 할 수 있습니다. 기존 시험지들은 너무 단순하거나 비디오의 여러 측면을 다 보지 못했는데, 이 새로운 시험지 Video-MME는 짧은 비디오부터 1시간짜리 긴 비디오까지, 스포츠, 다큐멘터리, 예능 등 다양한 종류의 비디오를 대상으로 합니다. 심지어 비디오 화면만 보는 게 아니라, 비디오에 나오는 자막이나 소리까지 듣고 이해해야 풀 수 있는 복잡한 문제들도 포함되어 있어서, AI 모델이 실제 비디오를 종합적으로 이해하는 능력을 정말 제대로 평가할 수 있도록 돕습니다. 실험 결과, 유료 AI(예: Gemini 1.5 ..
논문리뷰
2025. 6. 24. 13:38