목록0528 (1)
AI바라기의 인공지능

DeepSeek-R1-0528이 Release 되었습니다. 주요 벤치 성능은 다음과 같습니다. 자체 벤치 결과로는 o3와 gemini2.5 pro와 비교해도 손색없네요. Livebench 기준으로도 Sota 모델들에 비해 크게 밀리는 모습은 없네요. 리즈닝 능력이 많이 올라간게 핵심인 것 같습니다. 다음은 Artificial Analysis Intelligence Index 기준인데, 7개의 주요벤치 평균점수를 냅니다. 개인적으로 실체감과 직결되는 벤치라고 생각되는 건 아니지만 7개 모두 주의깊게 봐야할 벤치라고 판단하고 있습니다. 이 결과에서도 GeminiPro와 동급의 점수를 기록했네요.
논문리뷰
2025. 5. 30. 10:32