Google I/O 2026 : l'IA agentique au cœur de la stratégie de Google

Alors que les démonstrations de robots humanoïdes chinois impressionnent le monde entier, la bataille autour de l’IA générative reste toujours aussi disputée. Les champions chinois – Baidu, Alibaba avec son modèle Qwen, ou encore DeepSeek – tiennent leur rang, mais Google contre-attaque avec Gemini. L’objectif est clair : transformer l’IA en une couche d’action opérationnelle, capable de prendre des initiatives. Ses rivaux ne sont plus seulement OpenAI, mais aussi Anthropic et ses modèles Claude, devenus l’autre pôle majeur du secteur. Ainsi, Andrej Karpathy, le cocréateur d’OpenAI, s’apprête à rejoindre Anthropic. Le bras de fer à venir sera sans doute entre la maison mère de Claude et Google.

Gemini 3.5 Flash, toujours plus rapide

Ce modèle surpasse le précédent modèle “frontier” – le plus avancé de la gamme – Gemini 3.1 Pro. La dernière version de son outil d’IA maison s’impose sur la quasi-totalité des benchmarks du secteur. Sa vitesse de génération est quatre fois supérieure en termes de tokens, ces unités élémentaires du langage que l’IA produit mot après mot. Une version ultra-optimisée, intégrée directement à la plateforme Antigravity, pousse même ce rapport à 12 fois à qualité égale.

Un agent qui accuse dix secondes de latence à chaque étape est inutilisable sur des tâches complexes. Flash rend l’autonomie des agents réellement viable. Google vise des agents capables de construire des systèmes complexes, jusqu’à des environnements logiciels entiers. Le modèle s’impose notamment sur SWE-bench Verify, le test de référence mondial qui mesure l’aptitude d’une IA à corriger de vrais bugs dans des conditions réelles.

—

Bannière large Pickt — app de listes de courses collaboratives pour Telegram

Du côté de la concurrence : OpenAI s’aligne sur ce segment vitesse/coût avec GPT-4.1 et GPT-5. Anthropic, avec Claude Sonnet 4 et Claude Opus 4, reste la référence sectorielle sur le raisonnement avancé. Google annonce par ailleurs le déploiement de Gemini 3.5 Pro pour le mois prochain.

Gemini Omni Flash, la génération de la vidéo coûte que coûte

Un modèle multimodal – conçu dès l’origine pour traiter texte, son et image – capable de générer et d’éditer des vidéos à partir de n’importe quelle combinaison d’entrées. Il fusionne l’intelligence de Gemini avec les modèles médias de Google, Veo 3.1 Lite pour la vidéo et Nano Banana 2 pour l’image.

La démonstration – une explication en claymation du repliement des protéines – illustre sa capacité à marier connaissances scientifiques et génération visuelle. L’outil permet également de modifier une vidéo existante – changer un personnage, basculer le style visuel – en maintenant une cohérence narrative. Omni applique une logique physique intuitive sur l’ensemble des données reçues. L’idée est de mettre au point une IA de plus en plus consciente du monde qui l’entoure.

Disponibilité : dès mardi pour les abonnés Google AI+, Pro et Ultra, dans l’application Gemini, Google Flow et YouTube Shorts. Les accès développeurs via API arriveront dans les prochaines semaines, avant une version Omni Pro plus puissante. Tous les contenus intègrent le tatouage numérique invisible SynthID, pour lutter contre les deepfakes.

Du côté de la concurrence : OpenAI a mis entre parenthèses son outil de génération de vidéos Sora, mais Runway ML, Pika et Kling de Kuaishou se disputent le marché de la vidéo. Adobe intègre des fonctions similaires dans Firefly. L’enjeu clé reste la cohérence temporelle – la stabilité des visages, objets et éclairages d’une image à l’autre – tout comme la consommation énergétique, qui reste exponentielle sur ce type d’outils.

Antigravity 2.0, l’usine à agents

Initialement orienté vers le code, l’outil devient une plateforme complète de développement et d’orchestration d’agents autonomes. Elle réunit une application pour ordinateur, une interface en ligne de commande et un kit de développement clé en main, le tout optimisé pour les modèles Gemini.

Bannière post-article Pickt — app de listes de courses collaboratives avec illustration familiale

Concrètement, plusieurs IA spécialisées collaborent simultanément : un agent écrit le code d’un site Web, un deuxième conçoit les visuels, pendant qu’un troisième supervise l’architecture globale. L’infrastructure gère désormais des sessions autonomes de plusieurs heures – pipelines de code complexes ou projets de recherche itératifs.

Sécurité et concurrence : Alors que tout le monde a en tête Mythos, une IA si puissante qu’Anthropic hésite à le rendre accessible au grand public, Google introduit CodeMender, un outil de cybersécurité qui exploite le raisonnement de Gemini pour chercher à corriger les vulnérabilités critiques au cœur des programmes. Cette course aux agents mobilise aussi Anthropic et son Claude Code, OpenAI avec Operator ou encore Microsoft et son environnement Agent 365.

Le commerce agentique, quand la machine fait le shopping à votre place

Fini le temps perdu à ouvrir dix onglets, comparer les prix, remplir vos coordonnées et valider trois paniers différents. On passe d’un mode actif – où vous devez tout faire vous-même – à un mode dans lequel vous donnez une mission à votre IA et elle s’occupe de tout, de A à Z. Universal Commerce Protocol, le protocole mis en avant s’étend aux secteurs hôtelier et de la livraison de nourriture, avant de s’exporter hors des USA, en commençant par le Canada, l’Australie, ou encore le Royaume-Uni. Difficile de savoir quand cet outil sera disponible en France.

L’utilisateur doit pouvoir fixer ses propres limites. AP2 génère une piste d’audit numérique, partagée entre le client et le marchand pour simplifier les retours si l’IA s’est trompée. Google met également en avant Universal Cart : un panier multimarchands actif partout où vous naviguez sur le moteur de recherche mais aussi sur Gemini, ou encore YouTube. Il peut vous aider à détecter les erreurs avant que vous ne payiez.

Le rêve d’un majordome personnel

Google veut promouvoir un agent personnel intégré à son écosystème, vos environnements Workspace ou Chrome, actif y compris lorsque votre ordinateur est éteint ! L’application Gemini et sa version Live bénéficient d’un lifting avec une nouvelle interface baptisée « Neural Expressive » : animations fluides, légères vibrations haptiques et réponses structurées.

L’application intègre le « Daily Brief », un résumé matinal généré la nuit qui trie, priorise et planifie vos e-mails et rendez-vous. Spark propose d’autres services : fiches de révision pour les étudiants, suivi des e-mails clients pour les entrepreneurs et gestion des plannings familiaux. Attention, tout ceci n’est pas gratuit. Google ajuste sa grille – un nouveau plan Ultra est introduit à 100 dollars par mois, tandis que le plan maximal baisse de 250 à 200 dollars par mois.

Du côté de la concurrence : L’idée est de se rendre indispensable alors qu’OpenAI mise sur son ChatGPT Memory ou encore Microsoft avec Copilot intégré à Office. Chacun se bat sur le contrôle des données personnelles qui nourrissent l’agent. L’application Gemini a doublé sa base en un an – de 400 à 900 millions d’utilisateurs.

Après l’échec des Google Glass, le retour des lunettes connectées

Onze ans après l’échec des Google Glass, Google revient sur le marché des lunettes connectées. Deux modèles sont au programme : l’un mise sur l’audio et une caméra pour interagir avec Gemini, l’autre intègre des écrans dans les verres pour afficher navigation et traductions. Le tout tourne sous Android XR, la nouvelle plateforme de réalité mixte du groupe. Pour séduire le grand public, Google s’est associé à Gentle Monster, Samsung et Warby Parker. La navigation piétonne via Google Maps et la prise de photo à la voix ont déjà été démontrées en live.

Du côté de la concurrence : le marché est dominé par Meta et ses Ray-Ban, véritable succès commercial. Samsung promet ses propres lunettes connectées avant fin 2026, et le chinois Xreal avance son projet Aura, avec un champ de vision de 70 degrés sous Android XR. La bataille pour nos yeux connectés est lancée.

L’IA au service de la science

Demis Hassabis, Prix Nobel de chimie 2024, est monté sur scène pour présenter Gemini for Science, une plateforme regroupant des outils d’IA pour les chercheurs, dont un Co-Scientist, partenaire IA conçu pour accélérer les découvertes scientifiques. Le modèle WeatherNext a déjà fait ses preuves lors de l’ouragan Melissa en 2025, en offrant des prévisions plus précises et des alertes plus précoces. Dans un tout autre domaine, le premier médicament anticancéreux entièrement conçu par une IA doit entrer en phase 1 d’essais cliniques en 2026, via Isomorphic Labs, avec un pipeline de 17 programmes actifs couvrant oncologie, immunologie et maladies cardio-vasculaires. Pour Hassabis, l’âge d’or de la découverte scientifique est proche.

Ce qu’il faut retenir

On ne navigue plus dans des applications : on délègue des intentions. C’est le basculement qu’illustre Google I/O 2026. Un modèle douze fois plus rapide, des agents actifs la nuit sur vos e-mails et vos comptes bancaires, des protocoles ouverts qui dessinent les rails du commerce de demain – l’ambition est cohérente, l’exécution impressionnante. Google a clairement rattrapé son retard.

Mais quelques questions restent en suspens. Qui contrôle vraiment ces agents quand ils agissent en notre nom ? Google promet des garde-fous, mais c’est lui qui les conçoit – et qui en tire profit. La bataille des protocoles ouverts, UCP en tête, ressemble aussi à une stratégie de standardisation dont Mountain View espère bien devenir l’arbitre, comme il l’a fait avec Android ou Chrome.

La compétence clé de demain sera moins de savoir coder que de savoir instruire – et de décider, en connaissance de cause – ce qu’on accepte de déléguer à la machine. Rappeler enfin qu’une des priorités de l’IA est de s’attaquer au cancer, comme l’a fait Demis Hassabis, est salutaire. Il n’y a, heureusement, pas que l’IA générative dans la vie.