Blog Economie Numérique - Gemini, la nouvelle super IA de Google, risque de complètement ringardiser ChatGPT

Le 6 décembre 2023, Google a dévoilé Gemini, son dernier modèle d’intelligence artificielle (IA) présenté comme un « super modèle » surpassant les capacités humaines dans divers domaines, tels que la compréhension du langage à la réponse aux questions.

Google, un leader de l’IA

Google est un leader de l’intelligence artificielle (IA) depuis de nombreuses années. La société a investi massivement dans la recherche et le développement de l’IA, et ses produits et services sont utilisés par des millions de personnes dans le monde entier. L’IA est au cœur de nombreux produits de Google, tels que Google Translate, Google Maps, Google Photos et Google Assistant. Ces produits utilisent l’IA pour fournir des fonctionnalités telles que la traduction automatique, la navigation, le stockage et le traitement du langage naturel.

Innovation continue

Google continue d’innover dans le domaine de l’IA. En décembre 2023, la société a annoncé Gemini, un nouveau modèle d’IA générative. Gemini est capable d’analyser du texte, des images, du son et du code. Il représente une nouvelle étape dans la quête de Google pour repousser les limites de l’IA. Cette initiative souligne l’engagement constant de Google à rester à la pointe de la technologie et à offrir des solutions toujours plus avancées. Avec Gemini, Google cherche à consolider sa position de leader en proposant un modèle d’IA encore plus puissant que ChatGPT, ouvrant de nouvelles perspectives passionnantes dans le domaine de l’intelligence artificielle générative.

‘’notre modèle d’IA le plus grand et le plus performant’’ Sundar Pichai : PDG de Google et d’Alphabet

‘’Le plus grand et performant, Gemini, fruit de la collaboration entre les équipes de DeepMind et de Google Brain, incarne la dernière prouesse d’intelligence artificielle de Google. Actuellement en expérimentation aux États-Unis, il sera déployé mondialement l’année prochaine.

À l’intérieur des produits Google, Gemini révolutionne l’expérience utilisateur en affinant les recommandations, notamment via le chatbot expérimental Bard. Sa polyvalence facilite la transition d’une simple image à des réponses audio ou vidéo, élargissant les possibilités d’interaction homme-machine.

Cette avancée concrétise notre engagement à rendre l’IA accessible à tous, transformant notre vie quotidienne. Après près de huit ans de développement, l’IA générative est désormais utilisée par des millions de personnes, repoussant constamment les limites de ce que nous pouvions accomplir il y a seulement un an.

Comme souligné par Sundar Pichai, PDG de Google et Alphabet, et Demis Hassabis, PDG et cofondateur de Google DeepMind.’’

Performances exceptionnelles

Rigorusement testés et évalués pour des performances exceptionnelles, les modèles Gemini surpassent les standards actuels dans la recherche en langage et les modèles de grande envergure. De la compréhension d’images naturelles à la résolution de problèmes mathématiques, Gemini Ultra excelle, dépassant les références académiques dans 30 des 32 domaines couramment utilisés en recherche et développement de grands modèles de langage (large language model LLM). Avec un score remarquable de 90,0 %, Gemini Ultra devient le premier modèle à surpasser les experts humains en Massive Multitask Language Understanding (MMLU). Ce faisant, il couvre 57 matières, dont les mathématiques, la physique, l’histoire, le droit, la médecine et l’éthique, testant à la fois les connaissances du monde et les capacités de résolution de problèmes.

Capture d'écran du blog de Google — Capture d’écran du blog de Google

Comprendre le texte, les images, l’audio, etc.

Gemini 1.0 a été formé pour reconnaître et comprendre le texte, les images, l’audio et plus encore en même temps, afin de mieux comprendre les informations nuancées et de répondre aux questions relatives à des sujets compliqués. Cela le rend particulièrement efficace pour expliquer le raisonnement dans des matières complexes comme les mathématiques et la physique.

Codage avancé

Gemini, dans sa première version, démontre une capacité avancée de codage, capable de comprendre, expliquer et générer du code de haute qualité dans des langages de programmation répandus tels que Python, Java, C++ et Go. Sa compétence à opérer dans plusieurs langues et à raisonner sur des informations complexes en fait un modèle de référence mondial pour le codage.

Gemini Ultra excelle dans divers benchmarks de codage, y compris HumanEval, une norme majeure de l’industrie pour évaluer les performances dans les tâches de codage, ainsi que Natural2Code, un ensemble de données interne utilisant des sources générées par l’auteur plutôt que des informations basées sur le Web.

Plus fiable, évolutif et efficace

Gemini 1.0, alimenté par des unités de traitement Tensor (TPU) v4 et v5e conçues par Google, se distingue par sa fiabilité, son évolutivité et son efficacité exceptionnelles. Surpassant ses prédécesseurs, Gemini fonctionne rapidement, propulsant les produits Google basés sur l’IA. L’annonce du Cloud TPU v5p, le plus puissant à ce jour, accélérera le développement de Gemini, facilitant ainsi la formation rapide de modèles d’IA générative pour une mise sur le marché plus rapide.

Intégration de Gemini aux produits Google

Gemini Pro, intégré aux produits Google, offre des avancées significatives. Utilisé par Bard, il présente une mise à niveau majeure pour des capacités de raisonnement, de planification et de compréhension plus avancées. Disponible en anglais dans plus de 170 pays, il sera étendu à différentes modalités et prendra en charge de nouvelles langues et régions. Le Pixel 8 Pro, premier smartphone compatible avec Gemini Nano, propose des fonctionnalités innovantes comme Summarize dans l’application Recorder et Smart Reply dans Gboard, initialement sur des applications de messagerie telles que WhatsApp, Line et KakaoTalk. Gemini sera également déployé dans d’autres produits et services, tels que la recherche, les publicités, Chrome et Duet

Accessibilité aux développeurs et les entreprises :

À partir du 13 décembre, les développeurs et entreprises peuvent accéder à Gemini Pro via l’API Gemini dans Google AI Studio ou Google Cloud Vertex AI. Google AI Studio, un outil de développement Web gratuit, permet un prototypage rapide avec une clé API. Vertex AI offre une personnalisation de Gemini avec un contrôle total des données, intégrant des fonctionnalités de sécurité, sûreté, confidentialité, gouvernance et conformité des données d’entreprise.

Google Redéfinit l’IA avec Gemini

Gemini, le nouvel grand modèle de langage de Google, promet une intégration étendue à travers les produits phares du géant du numérique, dont la recherche, les annonces, et Bard. Google affirme avec confiance que Gemini se positionne à la hauteur, voire même au-dessus, du GPT-4 d’OpenAI. Cette avancée préfigure l’avenir de l’IA en dévoilant une orientation vers une compréhension et une interaction plus avancées en temps réel avec le contenu, laissant entrevoir des répercussions majeures dans des secteurs clés tels que la recherche, la publicité, et les expériences utilisateur.

Sources :

Gemini – Google DeepMind

Google Gemini: all the details on the AI model Google hopes can take on GPT-4 – The Verge

How Google Cloud is bringing Gemini to organizations everywhere | Google Cloud Blog

Google’s Gemini Is the Real Start of the Generative AI Boom | WIRED

Vidéos :

Gemini: All you need to know in 90 seconds (youtube.com)

Gemini : le modèle d’IA le plus récent et le plus performant de Google (youtube.com)

Google Gemini AI: How to Use Gemini AI with Bard Chatbot (vs GPT4) (youtube.com)

Gemini : Raisonner sur l’intention de l’utilisateur pour générer des expériences sur mesure (youtube.com)

Gemini : Expliquer le raisonnement en mathématiques et en physique (youtube.com)