★ Édition Spéciale Google I/O 2026 · Anthropic Stainless · GPT-5.5 · DeepSeek-V4 2,50 € · 4 pages

La Veille IA

Tous les signaux de l'intelligence artificielle qui méritent d'être imprimés

À la Une · Google I/O 2026

Gemini 3.5 Flash bouscule la frontière à vitesse Flash

Le nouveau modèle de DeepMind atteint 83,6 % sur MCP Atlas et 78,4 % sur OSWorld-Verified — quatre fois plus rapide que les autres modèles frontière.

Le 19 mai, en plein cœur de la conférence Google I/O 2026, DeepMind a dévoilé Gemini 3.5 Flash, présenté comme « frontier performance for agents and coding ».

La model card officielle détaille un context window d'un million de tokens et une couverture multimodale complète. Le score de 83,6 % sur MCP Atlas confirme que Google adopte publiquement le protocole MCP créé par Anthropic. L'écosystème agentic se standardise en croix.

Le modèle est disponible immédiatement via le Gemini API, Google AI Studio, Antigravity et la Gemini Enterprise Agent Platform.

I.Modèles & Frontière

Anthropic

Stainless rejoint le giron Anthropic

From the Wires — 18 mai

Le 18 mai, Anthropic a annoncé l'acquisition de Stainless, société spécialisée dans la génération automatique de SDK. Le mouvement préfigure une stratégie API-first plus serrée.

Anthropic · Microsoft

Claude entre dans Excel, Word et Outlook

From the Wires — 7 mai

Avec la disponibilité dans Microsoft 365, Anthropic place Claude en concurrence frontale avec Copilot dans l'ergonomie native des outils Office.

Anthropic · AWS

La Claude Platform débarque sur AWS

From the Wires — 11 mai

Sans passer par Bedrock, Anthropic distribue Claude directement sur AWS Marketplace.

DeepMind · Omni

Gemini Omni : « tout depuis tout »

From the Wires — 17 mai

Gemini Omni, modèle multimodal génératif, propose un montage vidéo conversationnel respectueux de la physique.

DeepMind · Antigravity

Antigravity 2.0 : la plateforme agentic de Google

From the Wires — 17 mai

Antigravity 2.0 est la réponse directe de Google aux Managed Agents d'Anthropic.

OpenAI · Dell

Codex se déploie sur l'infrastructure hybride

From the Wires — 18 mai

OpenAI scelle un partenariat avec Dell pour distribuer Codex en environnements hybrides et on-premise.

DeepSeek

V4 promet un contexte vraiment utilisable

From the Wires — 24 avril

Le titre « a million-token context that agents can actually use » claque sur le blog Hugging Face.

xAI · Coding

Grok Build CLI s'invite à la table

From the Wires — 15 mai

xAI lance Grok Build, agent de codage en ligne de commande. Quatrième CLI d'agent en six semaines.

NVIDIA

Nemotron 3 Nano Omni

From the Wires — 28 avril

Nemotron 3 Nano Omni combine intelligence multimodale et long-contexte dans une enveloppe nano.

Sommaire de l'édition

  1. À la UnePage 1 (vous y êtes) — Google I/O 2026 + Modèles & Frontière
  2. Le Cahier TechniquePage 2 — Agents de codage + Sandbox & Infrastructure
  3. La RecherchePage 3 — Apple ML papers + HuggingFace blog
  4. La Communauté & ÉditoPage 4 — Hacker News + Chronique stratégique

II.Agents de Codage

claude-code v2.1.145

Anthropic muscle son agent

Release — 19 mai 21h31

Les releases 142 à 145 introduisent l'Agent View, la commande /goal, le flag claude agents --json, et passent Opus 4.7 en mode par défaut.

codex CLI

Codex sort de l'IDE

Releases · enterprise

Les annonces « Work from anywhere » et Codex Windows sandbox placent OpenAI sur le terrain du computer-use.

gemini-cli 0.43

Gemini 3 Flash arrive dans le terminal

Release — 19 mai

La version 0.43 intègre Gemini 3 Flash : performance Pro à coût Flash.

III.Sandboxs & Infrastructure — Cloudflare Agents Week 2026

Cloudflare · Agents Week

Une semaine d'annonces agentic

20 avril — Recap

Le résumé complet : AI Platform unifiée, Email Service, Mesh privé, Dynamic Workers sandboxant 100× plus vite.

Cloudflare · AI Platform

Inference layer designed for agents

16 avril

L'AI Platform Cloudflare intègre désormais 14 fournisseurs de modèles avec binding Workers AI natif.

Cloudflare · Email

Email Service pour agents en beta publique

16 avril

Email natif pour agents : envoyer, recevoir et traiter des emails depuis un agent.

Cloudflare · Mesh

Networking privé pour agents

14 avril

Cloudflare Mesh : accès scoped aux ressources privées pour agents et Workers.

Cloudflare · Agent Lee

Dashboard agent sandboxé

15 avril

Agent Lee simplifie la gestion de la stack via prompts conversationnels en TypeScript sandboxé.

Cloudflare · Dynamic Workers

Sandboxing AI agents 100× plus vite

24 mars

Dynamic Workers permettent l'exécution sécurisée de code AI-généré 100 fois plus vite que les containers traditionnels.

IV.Le Carnet d'Apple ML Research

Apple ML · 6 mai

SpecMD optimise le prefetching d'experts MoE

Paper publié

L'étude SpecMD propose un framework d'évaluation des politiques de cache d'experts MoE, avec implications directes sur les déploiements Apple Silicon.

Apple ML · 11 mai

BalCapRL équilibre le RL pour MLLM

Paper publié

BalCapRL adresse les trade-offs de qualité dans le captionnage multimodal via reinforcement learning équilibré.

Apple ML · 8 mai

3D Gaussian Head Reconstruction

Paper publié

HeadsUp permet la reconstruction 3D de têtes depuis des configurations multi-caméras.

Apple ML · 8 mai

RVPO : Risk-Sensitive Alignment

Paper publié

RVPO pénalise la variance de récompense pour assurer une performance consistante en alignment multi-objectifs.

Apple ML · 7 mai

TC-JEPA : visual representations

Paper publié

TC-JEPA utilise des captions pour améliorer la prédiction de features masquées.

Apple ML · 6 mai

SFI-Bench : spatial-functional intelligence

Paper publié

SFI-Bench évalue les LLMs multimodaux sur le raisonnement spatial via vidéo egocentrée.

V.HuggingFace Blog — Top du mois

AllenAI · 19 mai

OlmoEarth v1.1

Model Release

AllenAI publie une famille de modèles Earth observation plus efficiente.

IBM · 14 mai

Granite Embedding Multilingual R2

Model Release

Granite revendique le meilleur retrieval sub-100M sous Apache 2.0, 32K context multilingue.

IBM · 18 mai

Open Agent Leaderboard

Benchmark

IBM Research publie un nouveau bench d'évaluation d'agents cross-vendor.

NVIDIA · 28 avril

Nemotron 3 Nano Omni multimodal

Model Release

Nemotron 3 Nano Omni combine intelligence multimodale et long-contexte.

HuggingFace · 14 mai

Async continuous batching

Library Update

L'asynchronicité débloquée dans le batching continu améliore le throughput d'inférence transformer.

ServiceNow · 6 mai

vLLM V0 → V1 correctness for RL

Library Update

vLLM améliore l'inférence pour les workflows de reinforcement learning.

NVIDIA · 18 mai

Cosmos Predict 2.5 LoRA/DoRA

Tutorial

Fine-tuning Cosmos Predict 2.5 avec LoRA/DoRA pour la robot video generation.

HuggingFace · 16 avril

Transformers vers MLX

Pattern

PR pattern automatique qui facilite le portage entre Transformers et MLX.

PaddlePaddle · 18 mai

PaddleOCR 3.5 + Transformers

Library Update

PaddleOCR 3.5 avec backend Transformers natif.

VI.La Communauté Hacker News

HN · 20 mai

Infrawise : MCP server infra context

Show HN

Infrawise donne à Claude Code un contexte d'infrastructure précis via MCP. Pattern intéressant pour les agents conscients de leur environnement de déploiement.

HN · 20 mai

Agent Thread : sessions claude-code publiques

Show HN

Agent Thread partage des sessions claude-code et codex sous forme de liens publics. La collaboration sur les workflows agentic s'organise.

HN · 20 mai

100 000 lignes de Rust avec IA

Deep dive

Retour d'expérience approfondi sur le passage à l'échelle du développement Rust assisté par IA.

HN · 20 mai

Trois générations d'applications IA

Framework

Cadre conceptuel distinguant conversationnel, délégatif et collaboratif comme étapes d'évolution des apps IA.

VII.Le Chronique Stratégique

Éditorial de la rédaction

La standardisation MCP arrive plus vite que prévu

Par la rédaction · 20 mai 2026

Le 19 mai 2026 restera comme une date charnière. Non pas pour Gemini 3.5 Flash, ni pour les Claude Managed Agents pris isolément, mais pour ce que ces annonces révèlent ensemble : le protocole MCP, créé par Anthropic pour ses propres outils, est devenu un standard d'industrie. Google le mesure publiquement via MCP Atlas. Anthropic en fait son canal d'exposition enterprise via les MCP tunnels. La frontière entre les écosystèmes labos s'efface.

Pour le praticien — celui qui maintient quelques serveurs MCP internes — la conséquence est concrète : les MCP servers développés aujourd'hui sont portables demain vers Gemini Enterprise Agent Platform, Antigravity, ou ce qu'OpenAI sortira sous le nom de Managed Agents. L'investissement dans MCP n'est plus locked-in chez Anthropic.

Le pattern qui se dessine pour les prochains mois : les sandbox providers — Cloudflare, Daytona, Modal, Vercel — deviennent le tissu connectif entre les boucles d'orchestration des labos et les infrastructures des entreprises. Cloudflare a déjà pris une avance d'une saison en publiant son Agents Week dès avril. Les autres suivront.

Quatre laboratoires publient en moins de six semaines leurs CLI d'agent : claude-code, codex, gemini-cli, grok-build-cli. Quatre implémentations du même concept, signe que le pattern est désormais une catégorie produit à part entière. Le développeur de 2027 aura le choix de son agent comme on choisissait son IDE en 2010.

★ ★ ★

Édition quotidienne automatique · archives

« All the AI that's fit to print »