Google avec la nouvelle version Gemini 3 (nouvelle génération de modèles d’intelligence artificielle) est décrit comme son système le plus « intelligent » et « beaucoup plus précis », il est surtout une offensive majeure pour reprendre la première place dans la course à l’IA, en profitant des difficultés de son rival OpenAI. Et pour la première fois, ce modèle phare est accessible à tous dès son lancement.

La principale nouveauté de Gemini 3 Pro est son caractère nativement multimodal. Concrètement, le modèle peut comprendre et traiter simultanément du texte, des images et de l’audio, au lieu de les gérer séparément. Par exemple, il peut analyser la photo d’une recette et la transformer en livre de cuisine, ou créer des fiches de révision interactives à partir d’une série de cours vidéo. Cette capacité va permettre l’émergence d’interfaces génératives, un outil en test qui permet à Gemini 3 Pro de créer des présentations visuelles, de type magazine, adaptées à la demande de l’utilisateur. La recherche Google alimentée par l’IA (Mode IA qui est disponible partout) bénéficiera aussi de ces avancées, avec des résultats enrichis d’images, de tableaux et de simulations. Voici les derniers résultats tests et le classement benchmarks:

Selon Google, le nouveau modèle offre des réponses intelligentes, concises et directes qui disent « ce que vous avez besoin d’entendre, pas seulement ce que vous voulez entendre ».
Pour appuyer ses dires, Google met en avant les performances de son modèle, qui se hisse au sommet du classement de référence LMArena, ainsi que ses capacités de raisonnement améliorées. De plus le mode Deep Think améliore encore davantage les capacités de raisonnement du modèle, mais il n’est actuellement disponible que pour les testeurs.

Screenshot

Laisser un commentaire