New results just dropped 🥳! We have integrated GPT-4.5 and Gemini-2.0-flash in our gaming agents and test them on Super Mario Bros. ⚔️
— Hao AI Lab (@haoailab) March 2, 2025
GPT-4.5 struggles due to high latency, Gemini-2.0-flash performs significantly better than Gemini-1.5-pro, on par with Claude-3.5.
Enjoy! 🎮 pic.twitter.com/17TrBCixfq
numerama - Super Mario, benchmark surprenant pour mesurer les prouesses de l’IA (entrainée pour jouer!)
En mode, suivez la règle
« Votre objectif est d’éviter les obstacles, les ennemis et les dangers »
Je peux dire qu'ils sont de loin ... meilleurs que moi =)
Super Mario, benchmark surprenant pour mesurer les prouesses de l’IA


Source: numerama.com
La vidéo: