The Neuron Times

La semaine où les agents ont cessé d’être des démos pour devenir des surfaces d’exécutionThe week agents stopped being demos and became execution surfacesDie Woche, in der Agenten aufhörten, Demos zu sein, und zu Ausführungsoberflächen wurdenLa settimana in cui gli agenti hanno smesso di essere demo per diventare superfici di esecuzioneLa setemana in cui i agent hinn cessaa d'esser di demo per diventà di superfìci d'esecuzion

N° 2026-W21 Édition hebdomadaireWeekly editionWochenausgabeEdizione settimanaleEdizion setemanal · Genève Lundi 25 mai 2026Monday, 25 May 2026Montag, 25. Mai 2026Lunedì 25 maggio 2026Lunedì 25 de magg 2026

À la Une · Infrastructure agentiqueFront Page · Agentic infrastructureAufmacher · Agentische InfrastrukturIn prima pagina · Infrastruttura agenticaIn prima pagina · Infrastruttura agentica

La standardisation des raccordements prend le pas sur la guerre des modèlesStandardising connections is overtaking the model warsDie Standardisierung der Anbindungen verdrängt den Krieg der ModelleLa standardizzazione dei collegamenti prevale sulla guerra dei modelliLa standardizzazion di raccordament la passa davanti a la guèra di modell

Au fil de la semaine, Google, OpenAI et Anthropic ont moins cherché à vendre un assistant qu’à imposer la couche qui relie modèles, outils internes et postes de travail.Over the course of the week, Google, OpenAI and Anthropic were less intent on selling an assistant than on imposing the layer that links models, internal tools and workstations.Im Verlauf der Woche bemühten sich Google, OpenAI und Anthropic weniger darum, einen Assistenten zu verkaufen, als vielmehr darum, die Schicht durchzusetzen, die Modelle, interne Werkzeuge und Arbeitsplätze verbindet.Nel corso della settimana, Google, OpenAI e Anthropic hanno cercato meno di vendere un assistente che di imporre il livello che collega modelli, strumenti interni e postazioni di lavoro.Nel cors de la setemana, Google, OpenAI e Anthropic hann cercaa manch de vend un assistent che d'impon la capa che collega modell, utij intern e post de laurà.

Le fait structurant de la semaine n’est pas seulement l’arrivée de Gemini 3.5 Flash, ni les nouveautés de Claude Managed Agents, ni même l’offensive d’OpenAI autour de Secure MCP Tunnel. C’est leur convergence. Les grands laboratoires décrivent désormais l’agent non comme une interface de chat améliorée, mais comme un système branché à des outils privés, des sandboxes, des sessions persistantes et des environnements d’entreprise.The defining development of the week is not simply the arrival of Gemini 3.5 Flash, nor the updates to Claude Managed Agents, nor even OpenAI’s push around Secure MCP Tunnel. It is their convergence. The leading labs now describe the agent not as an improved chat interface, but as a system plugged into private tools, sandboxes, persistent sessions and enterprise environments.Das prägende Ereignis der Woche ist nicht nur die Einführung von Gemini 3.5 Flash, noch die Neuerungen bei Claude Managed Agents, noch die Offensive von OpenAI rund um Secure MCP Tunnel. Entscheidend ist ihre Konvergenz. Die grossen Labore beschreiben den Agenten inzwischen nicht mehr als verbesserte Chat-Oberfläche, sondern als ein System, das an private Werkzeuge, Sandboxes, persistente Sitzungen und Unternehmensumgebungen angeschlossen ist.Il fatto strutturante della settimana non è soltanto l’arrivo di Gemini 3.5 Flash, né le novità di Claude Managed Agents, né tantomeno l’offensiva di OpenAI attorno a Secure MCP Tunnel. È la loro convergenza. I grandi laboratori descrivono ormai l’agente non come un’interfaccia di chat migliorata, ma come un sistema collegato a strumenti privati, sandbox, sessioni persistenti e ambienti aziendali.El fatt strutturant de la setemana no l'è domà l'arrivada de Gemini 3.5 Flash, nè i novità de Claude Managed Agents, nè gnanca l'ofensiva de OpenAI intorna a Secure MCP Tunnel. L'è la so convergenza. I grand laborator descriven adess l'agent no come un'interfacia de chat migliorada, ma come on sistema tacaa a utij privaa, sandbox, session persistent e ambient d'impresa.

Google a donné le ton en mesurant publiquement Gemini 3.5 Flash sur MCP Atlas dans sa model card, tout en l’insérant dans une pile qui va de Gemini CLI à Antigravity. Anthropic, de son côté, a déplacé l’exécution hors de son propre périmètre avec des sandboxes auto-hébergées et des tunnels MCP. OpenAI a répondu sur le terrain réseau et gouvernance en faisant du tunnel sécurisé une pièce officielle de sa plateforme.Google set the tone by publicly benchmarking Gemini 3.5 Flash on MCP Atlas in its model card, while placing it inside a stack that runs from Gemini CLI to Antigravity. Anthropic, for its part, moved execution beyond its own perimeter with self-hosted sandboxes and MCP tunnels. OpenAI answered on the terrain of networking and governance by making the secure tunnel an official part of its platform.Google gab den Ton an, indem es Gemini 3.5 Flash in seiner Model Card öffentlich an MCP Atlas mass und es zugleich in einen Stack einfügte, der von Gemini CLI bis zu Antigravity reicht. Anthropic wiederum verlagerte die Ausführung mit selbstgehosteten Sandboxes und MCP-Tunneln aus dem eigenen Perimeter hinaus. OpenAI antwortete auf dem Feld von Netzwerk und Governance, indem es den sicheren Tunnel zu einem offiziellen Baustein seiner Plattform machte.Google ha dato il tono misurando pubblicamente Gemini 3.5 Flash su MCP Atlas nella sua model card, inserendolo al tempo stesso in una pila che va da Gemini CLI a Antigravity. Anthropic, dal canto suo, ha spostato l’esecuzione fuori dal proprio perimetro con sandbox auto-ospitate e tunnel MCP. OpenAI ha risposto sul terreno della rete e della governance facendo del tunnel sicuro un elemento ufficiale della propria piattaforma.Google l'ha daa el ton mesurand publicament Gemini 3.5 Flash sora MCP Atlas nella soa model card, e intant inserendell in d'ona pila che la va de Gemini CLI a Antigravity. Anthropic, de la soa banda, l'ha spostaa l'esecuzion foeura del sò perimetr con sandbox auto-ospitaa e tunnel MCP. OpenAI l'ha rispost sul terren de la rete e de la governance, fasend del tunnel sicur ona part ufficial de la soa piattaforma.

Ce glissement compte davantage que la querelle habituelle sur les benchmarks, car il engage les six prochains mois d’intégration. Une entreprise peut changer de modèle, plus difficilement de protocole, de système de permissions, de surface d’exécution ou de schéma de raccordement à ses outils internes. La semaine a montré que la compétition se déplace vers ces couches intermédiaires: celles qui rendent un agent acceptable, durable et administrable dans un SI réel.This shift matters more than the usual quarrel over benchmarks, because it commits the next six months of integration. A company can change models; it is far harder to change protocol, permissions system, execution surface or the connection schema to its internal tools. The week showed that competition is moving toward these intermediate layers: the ones that make an agent acceptable, durable and manageable in a real-world information system.Diese Verschiebung wiegt schwerer als der übliche Streit um Benchmarks, denn sie betrifft die nächsten sechs Monate der Integration. Ein Unternehmen kann das Modell wechseln, weit weniger leicht jedoch das Protokoll, das Berechtigungssystem, die Ausführungsoberfläche oder das Anbindungsschema an seine internen Werkzeuge. Die Woche zeigte, dass sich der Wettbewerb auf diese Zwischenschichten verlagert: auf jene, die einen Agenten in einer realen IT-Landschaft akzeptabel, dauerhaft und administrierbar machen.Questo slittamento conta più della consueta disputa sui benchmark, perché impegna i prossimi sei mesi di integrazione. Un’azienda può cambiare modello, più difficilmente protocollo, sistema di permessi, superficie di esecuzione o schema di collegamento ai propri strumenti interni. La settimana ha mostrato che la competizione si sposta verso questi livelli intermedi: quelli che rendono un agente accettabile, durevole e amministrabile in un SI reale.Sto slittament el conta de pussee che la solita querela sui benchmark, perchè el impegna i ses prossim mes d'integrazion. Ona impresa la pò cambià modell, ma pussee fadigosament protocoll, sistema de permess, superfìcia d'esecuzion o schema de raccordament ai sò utij intern. La setemana l'ha mostraa che la competizion la se sposta vers ste cappe intermedie: quij che rendon on agent accettabil, duratur e amministrabil in on SI real.

La conséquence est nette pour le marché. Les modèles de frontière restent essentiels, mais la valeur se déplace vers les points de couture: connecteurs, CLI, sessions, postes distants, contrôle des coûts, routage et sécurité. Autrement dit, le secteur entre dans une phase où l’avantage ne viendra pas seulement du meilleur modèle, mais de la pile qui permet de le faire travailler sans rupture.The consequence for the market is clear. Frontier models remain essential, but value is moving toward the seams: connectors, CLI, sessions, remote workstations, cost control, routing and security. In other words, the sector is entering a phase in which advantage will come not only from the best model, but from the stack that lets it work without friction.Für den Markt ist die Folge klar. Frontier-Modelle bleiben wesentlich, doch der Wert verschiebt sich an die Nahtstellen: Konnektoren, CLI, Sitzungen, entfernte Arbeitsplätze, Kostenkontrolle, Routing und Sicherheit. Anders gesagt tritt die Branche in eine Phase ein, in der der Vorteil nicht nur vom besten Modell kommen wird, sondern vom Stack, der es ohne Brüche arbeiten lässt.La conseguenza è netta per il mercato. I modelli di frontiera restano essenziali, ma il valore si sposta verso i punti di cucitura: connettori, CLI, sessioni, postazioni remote, controllo dei costi, instradamento e sicurezza. In altre parole, il settore entra in una fase in cui il vantaggio non verrà soltanto dal modello migliore, ma dalla pila che permette di farlo lavorare senza interruzioni.La conseguenza l'è netta per el mercaa. I modell de frontiera restan essenzial, ma el valor el se sposta vers i pont de costura: connettor, CLI, session, post remòtt, controll di cost, routing e segurezz. In alter paroll, el setor el intra in d'ona fasa indoe el vantagg no vegna domà dal miglior modell, ma da la pila che permett de fallo laurà sensa rottur.

Page 1 — Page 1 — Seite 1 — Pagina 1 — Pagina 1 — Rétro FrontièreFrontier ReviewFrontier-RückblickRetrospettiva FrontieraRetro Frontiera

I. Modèles & FrontièreModels & FrontierModelle & FrontierModelli & FrontieraModell & Frontiera

Google DeepMind

Google DeepMind

Google DeepMind

Google DeepMind

Google DeepMind

Gemini 3.5 Flash fait de la vitesse un argument de frontièreGemini 3.5 Flash makes speed a frontier argumentGemini 3.5 Flash macht Geschwindigkeit zu einem Frontier-ArgumentGemini 3.5 Flash fa della velocità un argomento di frontieraGemini 3.5 Flash el fa de la velocità on argoment de frontiera

Google DeepMind a présenté Gemini 3.5 Flash comme un modèle pensé pour les agents et le code, avec une model card qui met en avant un contexte d’un million de tokens et des résultats sur MCP Atlas et OSWorld-Verified. Le signal important n’est pas seulement la performance, mais le fait que Google cadre désormais publiquement ses modèles à travers des tâches d’orchestration et d’exécution.Google DeepMind presented Gemini 3.5 Flash as a model built for agents and code, with a model card highlighting a one-million-token context window and results on MCP Atlas and OSWorld-Verified. The important signal is not performance alone, but the fact that Google is now publicly framing its models through orchestration and execution tasks.Google DeepMind hat Gemini 3.5 Flash als ein für Agenten und Code konzipiertes Modell vorgestellt, mit einer Model Card, die einen Kontext von einer Million Tokens und Resultate auf MCP Atlas und OSWorld-Verified hervorhebt. Das wichtige Signal ist nicht nur die Leistung, sondern dass Google seine Modelle nun öffentlich über Orchestrierungs- und Ausführungsaufgaben rahmt.Google DeepMind ha presentato Gemini 3.5 Flash come un modello pensato per gli agenti e il codice, con una model card che mette in risalto un contesto di un milione di token e risultati su MCP Atlas e OSWorld-Verified. Il segnale importante non è soltanto la prestazione, ma il fatto che Google inquadri ormai pubblicamente i propri modelli attraverso compiti di orchestrazione e di esecuzione.Google DeepMind l'ha presentaa Gemini 3.5 Flash come on modell pensaa per i agent e el code, con ona model card che la mett in evidenza on contest de on milion de token e di risultaa sora MCP Atlas e OSWorld-Verified. El segnal important no l'è domà la performance, ma el fatt che Google el quadra adess publicament i sò modell travers compit d'orchestrazion e d'esecuzion.

Google

Google

Google

Google

Google

Antigravity devient la pièce maîtresse de la pile agentique maisonAntigravity becomes the centrepiece of Google’s in-house agentic stackAntigravity wird zum Kernstück des hauseigenen agentischen StacksAntigravity diventa il pezzo forte della pila agentica internaAntigravity el diventa la part maestra de la pila agentica de cà

Avec Antigravity et la transition annoncée de Gemini CLI vers Antigravity CLI, Google redéfinit son terminal comme l’entrée d’une plateforme complète. L’entreprise ne vend plus un simple accès au modèle, mais une coordination entre éditeur, terminal, navigateur et suivi d’exécution.With Antigravity and the announced transition from Gemini CLI to Antigravity CLI, Google is redefining its terminal as the entry point to a full platform. The company is no longer selling simple model access, but coordination across editor, terminal, browser and execution tracking.Mit Antigravity und dem angekündigten Übergang von Gemini CLI zu Antigravity CLI definiert Google sein Terminal als Einstieg in eine vollständige Plattform neu. Das Unternehmen verkauft nicht mehr bloss einen Zugang zum Modell, sondern eine Koordination zwischen Editor, Terminal, Browser und Ausführungsverfolgung.Con Antigravity e la transizione annunciata da Gemini CLI ad Antigravity CLI, Google ridefinisce il proprio terminale come l’ingresso di una piattaforma completa. L’azienda non vende più un semplice accesso al modello, ma un coordinamento tra editor, terminale, browser e monitoraggio dell’esecuzione.Con Antigravity e la transizion anunziaa de Gemini CLI vers Antigravity CLI, Google el ridefiniss el sò terminal come l'entrada d'ona piattaforma completa. L'impresa no la venta pussee on sempi access al modell, ma ona coordinazion tra editor, terminal, navigador e seguiment d'esecuzion.

OpenAI

OpenAI

OpenAI

OpenAI

OpenAI

Codex s’étend du poste individuel au datacenter privéCodex extends from the individual workstation to the private datacentreCodex dehnt sich vom Einzelarbeitsplatz bis ins private Datacenter ausCodex si estende dalla postazione individuale al datacenter privatoCodex el s'estend del post individual al datacenter privaa

OpenAI a aligné plusieurs briques cette semaine: Codex 0.133.0, les nouveautés décrites dans les notes de version de ChatGPT, et un partenariat avec Dell pour les environnements hybrides et sur site. L’ensemble dessine un agent de développement conçu pour durer, être gouverné et travailler hors du seul cloud public.OpenAI lined up several building blocks this week: Codex 0.133.0, the updates described in the ChatGPT release notes, and a partnership with Dell for hybrid and on-premise environments. Taken together, they sketch a development agent designed to last, to be governed and to work beyond the public cloud alone.OpenAI hat diese Woche mehrere Bausteine aufeinander abgestimmt: Codex 0.133.0, die in den Release Notes von ChatGPT beschriebenen Neuerungen sowie eine Partnerschaft mit Dell für hybride und lokale Umgebungen. Insgesamt zeichnet sich ein Entwicklungsagent ab, der auf Dauer angelegt ist, sich steuern lässt und nicht nur in der Public Cloud arbeitet.OpenAI ha allineato diversi mattoni questa settimana: Codex 0.133.0, le novità descritte nelle note di rilascio di ChatGPT, e un partenariato con Dell per gli ambienti ibridi e on-premise. L’insieme delinea un agente di sviluppo concepito per durare, essere governato e lavorare oltre il solo cloud pubblico.OpenAI l'ha allineaa divers tòcch questa setemana: Codex 0.133.0, i novità descrivuu nei not de version de ChatGPT, e on partenariat con Dell per i ambient ibrid e on-premise. L'insiemma el disegna on agent de svilupp concepii per durà, vess governàa e laurà foeura del domà cloud publich.

Anthropic

Anthropic

Anthropic

Anthropic

Anthropic

Managed Agents et Glasswing élargissent la stratégie au-delà du modèleManaged Agents and Glasswing broaden the strategy beyond the modelManaged Agents und Glasswing erweitern die Strategie über das Modell hinausManaged Agents e Glasswing ampliano la strategia oltre il modelloManaged Agents e Glasswing i allargan la strategia al de là del modell

Les Claude Managed Agents introduisent des sandboxes auto-hébergées et des tunnels MCP, quand Project Glasswing remet la sécurisation des logiciels critiques au premier plan. En parallèle, l’acquisition de Stainless renforce l’axe API et SDK. La semaine montre un Anthropic moins centré sur la seule conversation que sur la chaîne complète de déploiement.The Claude Managed Agents introduce self-hosted sandboxes and MCP tunnels, while Project Glasswing pushes the securing of critical software back to the fore. In parallel, the acquisition of Stainless reinforces the API and SDK axis. The week shows an Anthropic less centred on conversation alone than on the full deployment chain.Die Claude Managed Agents führen selbstgehostete Sandboxes und MCP-Tunnel ein, während Project Glasswing die Absicherung kritischer Software wieder in den Vordergrund rückt. Parallel dazu stärkt die Übernahme von Stainless die Achse API und SDK. Die Woche zeigt ein Anthropic, das weniger auf das Gespräch allein konzentriert ist als auf die gesamte Deployment-Kette.I Claude Managed Agents introducono sandbox auto-ospitate e tunnel MCP, mentre Project Glasswing riporta in primo piano la messa in sicurezza del software critico. Parallelamente, l’acquisizione di Stainless rafforza l’asse API e SDK. La settimana mostra un’Anthropic meno concentrata sulla sola conversazione che sulla catena completa di distribuzione.I Claude Managed Agents introducen sandbox auto-ospitaa e tunnel MCP, quand che Project Glasswing el rimett in prima linea la messa in segurezz di software critic. In paralell, l'acquisizion de Stainless la rinforza l'ass API e SDK. La setemana la mostra on Anthropic manch centraa sora la sola conversazion che sora la cadena completa de deploy.

xAI et DeepSeek

xAI and DeepSeek

xAI und DeepSeek

xAI e DeepSeek

xAI e DeepSeek

Les challengers misent sur la distribution et les usages agentiquesChallengers are betting on distribution and agentic use casesDie Herausforderer setzen auf Distribution und agentische AnwendungsfälleGli sfidanti puntano su distribuzione e usi agenticiI challenger i puntan sora la distribuzion e i us agentich

xAI a multiplié les points d’entrée avec Grok Skills, Grok Build et l’intégration de Grok dans OpenClaw. DeepSeek a, de son côté, poussé une préversion de DeepSeek-V4 sur le web, l’application et l’API. Aucun de ces mouvements ne renverse seul la hiérarchie, mais tous renforcent la pression sur le segment des agents de production.xAI multiplied points of entry with Grok Skills, Grok Build and the integration of Grok into OpenClaw. DeepSeek, for its part, pushed a preview of DeepSeek-V4 across the web, the app and the API. None of these moves overturns the hierarchy on its own, but all intensify the pressure on the production-agent segment.xAI hat die Einstiegspunkte mit Grok Skills, Grok Build und der Integration von Grok in OpenClaw vervielfacht. DeepSeek wiederum hat eine Vorversion von DeepSeek-V4 im Web, in der App und über die API ausgerollt. Keine dieser Bewegungen stürzt die Hierarchie für sich allein um, doch alle erhöhen den Druck auf das Segment produktiver Agenten.xAI ha moltiplicato i punti d’ingresso con Grok Skills, Grok Build e l’integrazione di Grok in OpenClaw. DeepSeek, dal canto suo, ha spinto una preversione di DeepSeek-V4 sul web, nell’applicazione e nell’API. Nessuno di questi movimenti rovescia da solo la gerarchia, ma tutti rafforzano la pressione sul segmento degli agenti di produzione.xAI l'ha multiplicaa i pont d'entrada con Grok Skills, Grok Build e l'integrazion de Grok in OpenClaw. DeepSeek, de la soa banda, l'ha spingiu ona preversion de DeepSeek-V4 sul web, l'applicazion e l'API. Nisun de sti moviment el rovescia da per lü la gerarchia, ma tucc i rinforzan la pression sul segment di agent de produzion.

Page 2 — Page 2 — Seite 2 — Pagina 2 — Pagina 2 — Outils & PratiquesTools & PracticeWerkzeuge & PraxisStrumenti & PraticheUtij & Pratiche

I. Agents, CLI et exécutionAgents, CLI and executionAgenten, CLI und AusführungAgenti, CLI ed esecuzioneAgent, CLI ed esecuzion

Anthropic

Anthropic

Anthropic

Anthropic

Anthropic

Claude Code passe d’une phase de lancement à une phase de durcissementClaude Code moves from launch phase to hardening phaseClaude Code geht von einer Einführungsphase in eine Phase der Härtung überClaude Code passa da una fase di lancio a una fase di irrobustimentoClaude Code el passa d'ona fasa de lanciament a ona fasa de rinforzament

Les versions 2.1.145 et suivantes ont ajouté Agent View, /goal et davantage d’inspection sur les agents, avant d’enchaîner avec des correctifs sur Windows, MCP, les sessions en arrière-plan et Bash dans v2.1.148 et v2.1.149. Le produit commence à ressembler à un harnais de travail, pas à une démonstration.Versions 2.1.145 and after added Agent View, /goal and greater agent inspection, before following up with fixes for Windows, MCP, background sessions and Bash in v2.1.148 and v2.1.149. The product is beginning to look like a work harness, not a demonstration.Die Versionen 2.1.145 und folgende haben Agent View, /goal und mehr Einblick in die Agenten hinzugefügt, bevor mit v2.1.148 und v2.1.149 Korrekturen für Windows, MCP, Hintergrundsitzungen und Bash folgten. Das Produkt beginnt eher einem Arbeitsgeschirr als einer Demonstration zu ähneln.Le versioni 2.1.145 e successive hanno aggiunto Agent View, /goal e una maggiore ispezione sugli agenti, prima di proseguire con correzioni su Windows, MCP, le sessioni in background e Bash in v2.1.148 e v2.1.149. Il prodotto comincia ad assomigliare a un’imbracatura di lavoro, non a una dimostrazione.I version 2.1.145 e seguent hann aggiuntaa Agent View, /goal e pussee ispezion sui agent, prima de continuà con correzion sora Windows, MCP, i session in backgroud e Bash in v2.1.148 e v2.1.149. El prodott el comenza a somià a on arness de laurà, no a ona dimostrazion.

OpenAI

OpenAI

OpenAI

OpenAI

OpenAI

Codex fait des objectifs persistants et du contrôle distant sa colonne vertébraleCodex makes persistent goals and remote control its backboneCodex macht persistente Ziele und Fernsteuerung zu seinem RückgratCodex fa degli obiettivi persistenti e del controllo remoto la propria spina dorsaleCodex el fa di obiettiv persistent e del controll remòtt la soa colonna vertebral

La sortie de Codex 0.133.0 active les goals persistants par défaut et fait évoluer le contrôle distant vers un fonctionnement plus proche d’un service. Les notes de version de ChatGPT complètent ce tableau avec Appshots, Goal mode et l’accès distant depuis mobile, ce qui renforce l’idée d’un agent supervisé en continu.The release of Codex 0.133.0 enables persistent goals by default and moves remote control toward an operating model closer to a service. The ChatGPT release notes complete the picture with Appshots, Goal mode and remote access from mobile, reinforcing the idea of an agent under continuous supervision.Die Veröffentlichung von Codex 0.133.0 aktiviert persistente Goals standardmässig und entwickelt die Fernsteuerung in Richtung eines dienstähnlicheren Betriebs weiter. Die Release Notes von ChatGPT ergänzen dieses Bild mit Appshots, Goal Mode und Fernzugriff vom Mobilgerät, was die Vorstellung eines kontinuierlich überwachten Agenten stärkt.L’uscita di Codex 0.133.0 attiva i goal persistenti per default e fa evolvere il controllo remoto verso un funzionamento più vicino a un servizio. Le note di rilascio di ChatGPT completano questo quadro con Appshots, Goal mode e l’accesso remoto da mobile, rafforzando l’idea di un agente supervisionato in continuo.La sortida de Codex 0.133.0 l'attiva i goal persistent de default e la fa evolv el controll remòtt vers on funzionament pussee visin a on servizi. I not de version de ChatGPT i completan sto quader con Appshots, Goal mode e l'access remòtt de mobile, che rinforza l'idea d'on agent supervisaa in continuazion.

Google

Google

Google

Google

Google

Gemini CLI devient un produit d’orchestration plus qu’un simple client terminalGemini CLI becomes an orchestration product more than a simple terminal clientGemini CLI wird eher zu einem Orchestrierungsprodukt als zu einem blossen Terminal-ClientGemini CLI diventa un prodotto di orchestrazione più che un semplice client da terminaleGemini CLI el diventa on prodott d'orchestrazion pussee che on sempi client terminal

L’arrivée de Gemini 3 Flash dans Gemini CLI a été suivie d’une préversion 0.44 centrée sur l’architecture interne, puis d’un changement de cap vers Antigravity CLI. Le terminal est désormais pensé comme une surface de coordination agentique au sein d’une pile plus large.The arrival of Gemini 3 Flash in Gemini CLI was followed by a 0.44 preview centred on internal architecture, then by a strategic shift toward Antigravity CLI. The terminal is now conceived as an agentic coordination surface within a broader stack.Auf die Einführung von Gemini 3 Flash in Gemini CLI folgte eine auf die interne Architektur konzentrierte Vorversion 0.44 und danach ein Kurswechsel hin zu Antigravity CLI. Das Terminal ist nun als Oberfläche agentischer Koordination innerhalb eines breiteren Stacks gedacht.L’arrivo di Gemini 3 Flash in Gemini CLI è stato seguito da una preversione 0.44 centrata sull’architettura interna, poi da un cambio di rotta verso Antigravity CLI. Il terminale è ormai concepito come una superficie di coordinamento agentico all’interno di una pila più ampia.L'arrivada de Gemini 3 Flash in Gemini CLI l'è stada seguidada de ona preversion 0.44 centraa sora l'architettura interna, e poeu d'on cambiament de direzion vers Antigravity CLI. El terminal l'è adess pensaa come ona superfìcia de coordinazion agentica dent d'ona pila pussee larga.

Entreprise

Enterprise

Unternehmen

Impresa

Impresa

Secure MCP Tunnel fait entrer le réseau et la gouvernance dans le débat outillageSecure MCP Tunnel brings networking and governance into the tooling debateSecure MCP Tunnel bringt Netzwerk und Governance in die Debatte um Werkzeuge hineinSecure MCP Tunnel porta rete e governance nel dibattito sugli strumentiSecure MCP Tunnel el fa intrà la rete e la governance nel dibattit sora l'utensileria

Avec Secure MCP Tunnel, OpenAI officialise un mécanisme pour relier ChatGPT, Codex, AgentKit et l’API Responses à des serveurs MCP privés sans exposition publique. Le point est décisif: l’accès aux outils internes devient une question d’architecture réseau et de conformité, pas seulement d’appels d’API.With Secure MCP Tunnel, OpenAI is formalising a mechanism to connect ChatGPT, Codex, AgentKit and the Responses API to private MCP servers without public exposure. The point is decisive: access to internal tools becomes a matter of network architecture and compliance, not merely API calls.Mit Secure MCP Tunnel formalisiert OpenAI einen Mechanismus, um ChatGPT, Codex, AgentKit und die Responses API mit privaten MCP-Servern zu verbinden, ohne öffentliche Exponierung. Der Punkt ist entscheidend: Der Zugang zu internen Werkzeugen wird zu einer Frage von Netzwerkarchitektur und Compliance, nicht bloss von API-Aufrufen.Con Secure MCP Tunnel, OpenAI ufficializza un meccanismo per collegare ChatGPT, Codex, AgentKit e l’API Responses a server MCP privati senza esposizione pubblica. Il punto è decisivo: l’accesso agli strumenti interni diventa una questione di architettura di rete e di conformità, non soltanto di chiamate API.Con Secure MCP Tunnel, OpenAI l'ufficializa on meccanism per collegà ChatGPT, Codex, AgentKit e l'API Responses a di server MCP privaa sensa esposizion publica. El pont l'è decisiv: l'access ai utij intern el diventa ona question d'architettura de rete e de conformità, no domà de ciamada API.

Local

Local

Lokal

Locale

Local

L’inférence locale continue sa marche d’entretien méthodiqueLocal inference continues its methodical maintenance marchDie lokale Inferenz setzt ihren methodischen Wartungsmarsch fortL’inferenza locale continua la propria marcia di manutenzione metodicaL'inferenza local la continua la soa marcia de manutenzion metodica

Côté exécution locale, llama.cpp b9305 a livré un correctif de build pour son interface, tandis que Rapid-MLX v0.6.66 a corrigé son flux de sortie et le mode no-tools. Ces annonces sont modestes, mais elles rappellent que l’adoption dépend aussi d’une maintenance silencieuse des briques les plus utilisées.On the local-execution side, llama.cpp b9305 delivered a build fix for its interface, while Rapid-MLX v0.6.66 corrected its output stream and no-tools mode. These announcements are modest, but they are a reminder that adoption also depends on the quiet maintenance of the most widely used building blocks.Bei der lokalen Ausführung lieferte llama.cpp b9305 eine Build-Korrektur für seine Oberfläche, während Rapid-MLX v0.6.66 seinen Ausgabefluss und den Modus no-tools korrigierte. Diese Ankündigungen sind bescheiden, erinnern aber daran, dass die Adoption auch von stiller Wartung der meistgenutzten Bausteine abhängt.Sul fronte dell’esecuzione locale, llama.cpp b9305 ha fornito una correzione di build per la propria interfaccia, mentre Rapid-MLX v0.6.66 ha corretto il proprio flusso di uscita e la modalità no-tools. Questi annunci sono modesti, ma ricordano che l’adozione dipende anche da una manutenzione silenziosa dei mattoni più usati.De la banda de l'esecuzion local, llama.cpp b9305 l'ha consegnaa on correttiv de build per la soa interfacia, mentar che Rapid-MLX v0.6.66 l'ha corrett el sò fluss d'uscida e el mode no-tools. Sti anunzi hinn modest, ma i recordan che l'adozion la dipend anca de ona manutenzion silenziosa di tòcch pussee dovrada.

Page 3 — Page 3 — Seite 3 — Pagina 3 — Pagina 3 — RechercheResearchForschungRicercaRicerca

I. Papiers & publicationsPapers & publicationsPapiere & PublikationenPaper & pubblicazioniPaper & publicazion

OpenAI

OpenAI

OpenAI

OpenAI

OpenAI

Une percée en géométrie discrète sert de marqueur scientifiqueA breakthrough in discrete geometry serves as a scientific markerEin Durchbruch in der diskreten Geometrie dient als wissenschaftlicher MarkerUn progresso nella geometria discreta funge da marcatore scientificoOna svolta in geometria discreta la serv de marcatore scientific

OpenAI a mis en avant un travail présenté comme la réfutation d’une conjecture centrale en géométrie discrète, relayé dans son flux officiel. Même sans entrer ici dans la méthode, la publication compte comme signal de positionnement: l’entreprise veut continuer à être lue comme un laboratoire de recherche fondamentale autant que comme un fournisseur de produits.OpenAI highlighted work presented as the refutation of a central conjecture in discrete geometry, relayed through its official feed. Even without entering into the method here, the publication matters as a positioning signal: the company wants to continue being read as a fundamental research lab as much as a product supplier.OpenAI stellte eine Arbeit heraus, die als Widerlegung einer zentralen Vermutung der diskreten Geometrie präsentiert wird, weitergetragen im offiziellen Feed. Auch ohne hier auf die Methode einzugehen, zählt die Publikation als Positionierungssignal: Das Unternehmen will weiterhin ebenso als Grundlagenforschungslabor gelesen werden wie als Anbieter von Produkten.OpenAI ha messo in rilievo un lavoro presentato come la confutazione di una congettura centrale in geometria discreta, ripreso nel suo flusso ufficiale. Anche senza entrare qui nel metodo, la pubblicazione conta come segnale di posizionamento: l’azienda vuole continuare a essere letta come un laboratorio di ricerca fondamentale tanto quanto come un fornitore di prodotti.OpenAI l'ha mett in evidenza on laurà presentaa come la confutazion d'ona congettura central in geometria discreta, ripres nel sò fluss ufficial. Anca sensa intrà chì nel metod, la publicazion la conta come segnal de posizionament: l'impresa la vœur continuà a vess letta come on laboratori de ricerca fundamental tant quant come on fornitor de prodott.

Apple

Apple

Apple

Apple

Apple

VSAS-Bench déplace l’évaluation vers la proactivité en flux continuVSAS-Bench shifts evaluation toward proactivity in continuous streamsVSAS-Bench verlagert die Evaluation auf Proaktivität im kontinuierlichen StromVSAS-Bench sposta la valutazione verso la proattività in flusso continuoVSAS-Bench el sposta la valutazion vers la proattività in fluss continu

Avec VSAS-Bench, Apple propose un cadre pour mesurer des assistants visuels en temps réel, en insistant sur la réactivité et la cohérence au fil des images. Le déplacement est notable: l’enjeu n’est plus seulement l’exactitude hors ligne, mais le bon moment d’intervention d’un système embarqué ou continu.With VSAS-Bench, Apple proposes a framework for measuring visual assistants in real time, emphasising responsiveness and consistency across image streams. The shift is notable: the issue is no longer only offline accuracy, but the right moment for intervention by an embedded or continuous system.Mit VSAS-Bench schlägt Apple einen Rahmen zur Messung visueller Assistenten in Echtzeit vor und betont dabei Reaktionsfähigkeit und Kohärenz im Verlauf der Bilder. Die Verschiebung ist bemerkenswert: Es geht nicht mehr nur um Offline-Genauigkeit, sondern um den richtigen Eingriffszeitpunkt eines eingebetteten oder kontinuierlichen Systems.Con VSAS-Bench, Apple propone un quadro per misurare assistenti visivi in tempo reale, insistendo sulla reattività e sulla coerenza lungo la sequenza delle immagini. Lo spostamento è notevole: la posta in gioco non è più soltanto l’accuratezza offline, ma il giusto momento di intervento di un sistema integrato o continuo.Con VSAS-Bench, Apple la propon on quader per misurà assistent visual in temp real, insistend sora la reattività e la coerenza de immagin in immagin. El spostament l'è notabil: la posta in giugh no l'è pussee domà l'esatezza offline, ma el moment giust d'intervent d'on sistema embarcaa o continu.

NVIDIA

NVIDIA

NVIDIA

NVIDIA

NVIDIA

Nemotron-Labs défend la diffusion comme voie d’accélération textuelleNemotron-Labs argues for diffusion as a path to faster text generationNemotron-Labs verteidigt Diffusion als Weg textueller BeschleunigungNemotron-Labs difende la diffusione come via di accelerazione testualeNemotron-Labs el difend la diffusion come strada d'accelerazion testual

Dans son billet publié sur Hugging Face, NVIDIA détaille des modèles de langage par diffusion visant une génération plus rapide que les schémas autoregressifs classiques. Le texte ne bouleverse pas encore le centre du marché, mais il rappelle que l’innovation en architecture reste active au-delà de la seule course à l’échelle.In its post published on Hugging Face, NVIDIA details diffusion language models aimed at generation faster than classic autoregressive schemes. The text does not yet upend the market’s centre, but it is a reminder that architectural innovation remains active beyond the race for scale alone.In seinem auf Hugging Face veröffentlichten Beitrag erläutert NVIDIA Diffusions-Sprachmodelle, die eine schnellere Generierung als klassische autoregressive Schemata anstreben. Der Text verschiebt das Marktzentrum noch nicht, erinnert aber daran, dass architektonische Innovation jenseits des blossen Wettlaufs um Grösse aktiv bleibt.Nel suo articolo pubblicato su Hugging Face, NVIDIA dettaglia modelli di linguaggio per diffusione che mirano a una generazione più rapida rispetto agli schemi autoregressivi classici. Il testo non sconvolge ancora il centro del mercato, ma ricorda che l’innovazione architetturale resta attiva oltre la sola corsa alla scala.In el sò post publicaa sora Hugging Face, NVIDIA la dettaglia modell de lenguagg per diffusion che miran a ona generazion pussee rapida che i schem autoregressiv classic. El test no l'altera ancmò el centr del mercaa, ma el regorda che l'innovazion d'architettura la resta attiva al de là de la sola corsa a la scala.

IBM Research

IBM Research

IBM Research

IBM Research

IBM Research

L’Open Agent Leaderboard consacre l’évaluation des systèmes completsThe Open Agent Leaderboard enshrines evaluation of full systemsDas Open Agent Leaderboard weiht die Bewertung vollständiger Systeme einL’Open Agent Leaderboard consacra la valutazione dei sistemi completiL'Open Agent Leaderboard el consacra la valutazion di sistem complet

Le billet The Open Agent Leaderboard, porté par IBM Research sur le blog Hugging Face, signale une évolution du débat public: il ne s’agit plus seulement de comparer des modèles, mais des agents entiers. Benchmarks, harnais et outils deviennent eux-mêmes des objets de compétition mesurable.The post The Open Agent Leaderboard, carried by IBM Research on the Hugging Face blog, signals an evolution in the public debate: the point is no longer simply to compare models, but entire agents. Benchmarks, harnesses and tools themselves are becoming objects of measurable competition.Der Beitrag The Open Agent Leaderboard, getragen von IBM Research auf dem Hugging-Face-Blog, signalisiert eine Veränderung der öffentlichen Debatte: Es geht nicht mehr nur darum, Modelle zu vergleichen, sondern ganze Agenten. Benchmarks, Harnesses und Werkzeuge werden selbst zu Gegenständen messbaren Wettbewerbs.L’articolo The Open Agent Leaderboard, firmato da IBM Research sul blog di Hugging Face, segnala un’evoluzione del dibattito pubblico: non si tratta più soltanto di confrontare modelli, ma agenti interi. Benchmark, harness e strumenti diventano essi stessi oggetti di competizione misurabile.El post The Open Agent Leaderboard, porta avanti de IBM Research sul blog de Hugging Face, el segnala ona evoluzion del dibattit publich: no se tratta pussee domà de comparà modell, ma agent intier. Benchmark, arness e utij i diventan lor medem oggett de competizion misurabil.

Page 4 — Page 4 — Seite 4 — Pagina 4 — Pagina 4 — Édito hebdoWeekly editorialWochenkommentarEditoriale settimanaleEditoriai setemanal

I. La semaine en perspectiveThe week in perspectiveDie Woche in der PerspektiveLa settimana in prospettivaLa setemana in prospettiva

Édito

Editorial

Kommentar

Editoriale

Editoriai

Le centre de gravité de l’IA glisse vers les couches intermédiairesAI’s centre of gravity is shifting toward the intermediate layersDas Gravitationszentrum der KI verschiebt sich zu den ZwischenschichtenIl centro di gravità dell’IA scivola verso i livelli intermediEl centr de gravità de l'IA el slitta vers i cappe intermedie

Pendant longtemps, le secteur a pu se raconter comme une succession de grands dévoilements de modèles. Chaque cycle semblait dominé par une question simple: qui a franchi la frontière suivante? Cette semaine a montré autre chose. Les annonces les plus structurantes n’étaient pas seulement des gains de score ou des contextes plus vastes; elles concernaient les moyens de faire travailler les modèles dans des environnements réels. Quand Google met Gemini 3.5 Flash en avant tout en le reliant à Antigravity, quand Anthropic fait des sandboxes auto-hébergées et tunnels MCP une extension de Claude, et quand OpenAI officialise Secure MCP Tunnel, le récit dominant change. Le modèle reste la pièce maîtresse, mais il n’est plus le produit entier. Ce déplacement a une logique économique très nette. Les modèles, aussi différenciés soient-ils, deviennent comparables plus vite que les infrastructures qui les entourent. En revanche, les couches intermédiaires — CLI, sessions persistantes, connecteurs MCP, profils de permissions, harnais d’exécution, supervision mobile, sandboxes, accès aux outils privés — créent des habitudes, des dépendances et des coûts de migration bien plus lourds. C’est là que se construisent les vrais verrous de la prochaine phase. Une entreprise peut arbitrer entre deux modèles pour une tâche donnée; elle hésitera davantage à refaire sa manière d’exposer ses outils internes, de gouverner les permissions ou d’observer les actions d’un agent dans un terminal, un IDE et un navigateur. C’est pourquoi la standardisation implicite autour de MCP mérite plus d’attention qu’un benchmark isolé. Google le reconnaît à travers la manière dont il décrit ses modèles et son outillage. Anthropic en fait un canal opérationnel. OpenAI, sans reprendre exactement le même récit, traite le problème voisin: comment relier proprement les agents à des systèmes privés sans les exposer. Le sujet de la semaine n’est donc pas seulement l’interopérabilité technique; c’est la naissance d’un terrain commun de raccordement. Si cette couche se stabilise, les six prochains mois pourraient voir la concurrence se déplacer encore davantage vers la qualité d’orchestration, de sécurité et d’expérience développeur, plutôt que vers la seule supériorité brute du modèle. Cette transformation rebat aussi la hiérarchie des acteurs. Les grands laboratoires gardent l’avantage de la distribution, du capital et des meilleurs modèles, mais les fournisseurs d’infrastructure, les éditeurs de harnais et les plateformes d’exécution récupèrent une part du pouvoir. Quand l’exécution part chez des sandboxes tierces, quand les tunnels réseau deviennent une brique critique, quand la maintenance d’une CLI compte autant que le modèle sous-jacent pour la fiabilité quotidienne, le centre du système s’élargit. Les gagnants ne seront pas seulement ceux qui répondent le mieux à une question, mais ceux qui s’insèrent le plus proprement dans une organisation déjà complexe. Le plus frappant, au fond, est le retour du banal. Une commande renommée pour mieux cadrer la revue de code. Une session épinglée qui survit à une mise à jour. Un correctif Bash livré sans délai. Un benchmark qui mesure enfin la proactivité d’un assistant visuel continu. Ce sont des détails, mais ils décrivent une industrie qui commence à quitter la rhétorique de la démonstration pour entrer dans celle de l’exploitation. C’est souvent à ce moment-là qu’un marché devient sérieux. La semaine écoulée n’a donc pas seulement ajouté quelques produits à une liste déjà longue. Elle a clarifié où se jouera la bataille suivante. Non plus uniquement sur la question de savoir quel laboratoire produit le modèle le plus impressionnant, mais sur celle, plus concrète, de savoir quel écosystème permet à ce modèle de travailler durablement, sûrement et sans friction. C’est un changement moins spectaculaire qu’un lancement vedette. Il est probablement plus décisif.For a long time, the sector could describe itself as a succession of major model unveilings. Each cycle seemed dominated by a simple question: who had crossed the next frontier? This week showed something else. The most consequential announcements were not merely score gains or broader context windows; they concerned the means of putting models to work in real environments. When Google pushes Gemini 3.5 Flash while connecting it to Antigravity, when Anthropic makes self-hosted sandboxes and MCP tunnels an extension of Claude, and when OpenAI formalises Secure MCP Tunnel, the dominant narrative changes. The model remains the centrepiece, but it is no longer the whole product. This shift has a very clear economic logic. Models, however differentiated they may be, become comparable faster than the infrastructures around them. By contrast, the intermediate layers — CLI, persistent sessions, MCP connectors, permission profiles, execution harnesses, mobile supervision, sandboxes, access to private tools — create habits, dependencies and migration costs that are far heavier. That is where the real lock-ins of the next phase are being built. A company may arbitrate between two models for a given task; it will be more hesitant to rebuild the way it exposes its internal tools, governs permissions or observes an agent’s actions across a terminal, an IDE and a browser. That is why the implicit standardisation around MCP deserves more attention than an isolated benchmark. Google acknowledges it through the way it describes its models and tooling. Anthropic is turning it into an operational channel. OpenAI, without adopting exactly the same narrative, is addressing the adjacent problem: how to connect agents cleanly to private systems without exposing them. The subject of the week, then, is not only technical interoperability; it is the birth of a common connection ground. If that layer stabilises, the next six months could see competition move even further toward the quality of orchestration, security and developer experience, rather than the model’s raw superiority alone. This transformation is also reshuffling the hierarchy of players. The major labs retain the advantage of distribution, capital and the best models, but infrastructure suppliers, harness vendors and execution platforms are reclaiming a share of power. When execution moves to third-party sandboxes, when network tunnels become a critical building block, when maintenance of a CLI matters as much as the underlying model for day-to-day reliability, the centre of the system widens. The winners will not simply be those that answer a question best, but those that fit most cleanly into an organisation that is already complex. Most striking, at bottom, is the return of the ordinary. A command renamed to better frame code review. A pinned session that survives an update. A Bash fix shipped without delay. A benchmark that finally measures the proactivity of a continuous visual assistant. These are details, but they describe an industry beginning to leave the rhetoric of the demonstration and enter that of operations. That is often the moment when a market becomes serious. The past week, then, did not merely add a few more products to an already long list. It clarified where the next battle will be fought. No longer solely over which lab produces the most impressive model, but over the more concrete question of which ecosystem allows that model to work durably, safely and without friction. It is a less spectacular change than a marquee launch. It is probably more decisive.Lange konnte sich die Branche als eine Abfolge grosser Modellenthüllungen erzählen. Jeder Zyklus schien von einer einfachen Frage beherrscht: Wer hat die nächste Grenze überschritten? Diese Woche zeigte etwas anderes. Die prägendsten Ankündigungen waren nicht nur Punktgewinne oder grössere Kontexte; sie betrafen die Mittel, mit denen Modelle in realen Umgebungen arbeiten. Wenn Google Gemini 3.5 Flash hervorhebt und es zugleich mit Antigravity verbindet, wenn Anthropic selbstgehostete Sandboxes und MCP-Tunnel zu einer Erweiterung von Claude macht und wenn OpenAI Secure MCP Tunnel formalisiert, dann ändert sich die dominante Erzählung. Das Modell bleibt das Herzstück, aber es ist nicht mehr das ganze Produkt. Diese Verschiebung folgt einer klaren ökonomischen Logik. Modelle, so differenziert sie auch sein mögen, werden schneller vergleichbar als die Infrastrukturen, die sie umgeben. Die Zwischenschichten hingegen — CLI, persistente Sitzungen, MCP-Konnektoren, Berechtigungsprofile, Ausführungs-Harnesses, mobile Überwachung, Sandboxes, Zugang zu privaten Werkzeugen — schaffen Gewohnheiten, Abhängigkeiten und deutlich höhere Migrationskosten. Hier entstehen die eigentlichen Lock-ins der nächsten Phase. Ein Unternehmen kann zwischen zwei Modellen für eine bestimmte Aufgabe abwägen; weit stärker zögern wird es, seine Art neu zu bauen, interne Werkzeuge bereitzustellen, Berechtigungen zu steuern oder die Aktionen eines Agenten in einem Terminal, einer IDE und einem Browser zu beobachten. Darum verdient die implizite Standardisierung rund um MCP mehr Aufmerksamkeit als ein isolierter Benchmark. Google räumt dies ein, durch die Art, wie es seine Modelle und Werkzeuge beschreibt. Anthropic macht daraus einen operativen Kanal. OpenAI behandelt, ohne genau dieselbe Erzählung zu übernehmen, das benachbarte Problem: wie sich Agenten sauber mit privaten Systemen verbinden lassen, ohne sie offenzulegen. Das Thema der Woche ist daher nicht nur technische Interoperabilität; es ist die Entstehung eines gemeinsamen Terrains der Anbindung. Stabilisiert sich diese Schicht, könnten die nächsten sechs Monate den Wettbewerb noch stärker in Richtung Orchestrierungsqualität, Sicherheit und Developer Experience verschieben als in Richtung blosser Rohüberlegenheit des Modells. Diese Transformation mischt auch die Hierarchie der Akteure neu. Die grossen Labore behalten den Vorteil bei Distribution, Kapital und den besten Modellen, doch Infrastrukturanbieter, Herausgeber von Harnesses und Ausführungsplattformen gewinnen einen Teil der Macht zurück. Wenn die Ausführung zu Dritt-Sandboxes wandert, wenn Netzwerktunnel zu einem kritischen Baustein werden, wenn die Wartung einer CLI für die tägliche Verlässlichkeit ebenso zählt wie das zugrunde liegende Modell, dann erweitert sich das Zentrum des Systems. Die Gewinner werden nicht nur jene sein, die auf eine Frage am besten antworten, sondern jene, die sich am saubersten in eine bereits komplexe Organisation einfügen. Am auffälligsten ist letztlich die Rückkehr des Banalen. Ein umbenannter Befehl, um Code Review besser zu rahmen. Eine angeheftete Sitzung, die ein Update überlebt. Eine Bash-Korrektur, die ohne Verzögerung ausgeliefert wird. Ein Benchmark, der endlich die Proaktivität eines kontinuierlichen visuellen Assistenten misst. Das sind Details, aber sie beschreiben eine Industrie, die beginnt, die Rhetorik der Demonstration zu verlassen und in jene des Betriebs einzutreten. Oft wird ein Markt genau in diesem Moment ernsthaft. Die vergangene Woche hat also nicht nur einige Produkte zu einer bereits langen Liste hinzugefügt. Sie hat geklärt, wo die nächste Auseinandersetzung stattfinden wird. Nicht mehr nur bei der Frage, welches Labor das beeindruckendste Modell hervorbringt, sondern bei der konkreteren Frage, welches Ökosystem es diesem Modell erlaubt, dauerhaft, sicher und reibungslos zu arbeiten. Das ist ein weniger spektakulärer Wandel als ein prominenter Launch. Wahrscheinlich ist er der entscheidendere.Per molto tempo, il settore ha potuto raccontarsi come una successione di grandi presentazioni di modelli. Ogni ciclo sembrava dominato da una domanda semplice: chi ha oltrepassato la frontiera successiva? Questa settimana ha mostrato altro. Gli annunci più strutturanti non erano soltanto guadagni di punteggio o contesti più ampi; riguardavano i mezzi per far lavorare i modelli in ambienti reali. Quando Google mette in primo piano Gemini 3.5 Flash collegandolo al tempo stesso a Antigravity, quando Anthropic fa di sandbox auto-ospitate e tunnel MCP un’estensione di Claude, e quando OpenAI ufficializza Secure MCP Tunnel, il racconto dominante cambia. Il modello resta il pezzo forte, ma non è più il prodotto intero. Questo spostamento ha una logica economica molto netta. I modelli, per quanto differenziati, diventano comparabili più in fretta delle infrastrutture che li circondano. Per contro, i livelli intermedi — CLI, sessioni persistenti, connettori MCP, profili di permesso, harness di esecuzione, supervisione mobile, sandbox, accesso agli strumenti privati — creano abitudini, dipendenze e costi di migrazione molto più pesanti. È lì che si costruiscono i veri vincoli della prossima fase. Un’azienda può arbitrare tra due modelli per un compito dato; esiterà di più a rifare il proprio modo di esporre gli strumenti interni, di governare i permessi o di osservare le azioni di un agente in un terminale, un IDE e un browser. Per questo la standardizzazione implicita attorno a MCP merita più attenzione di un benchmark isolato. Google lo riconosce attraverso il modo in cui descrive i propri modelli e i propri strumenti. Anthropic ne fa un canale operativo. OpenAI, senza riprendere esattamente lo stesso racconto, tratta il problema vicino: come collegare correttamente gli agenti a sistemi privati senza esporli. Il tema della settimana non è dunque soltanto l’interoperabilità tecnica; è la nascita di un terreno comune di collegamento. Se questo livello si stabilizza, i prossimi sei mesi potrebbero vedere la concorrenza spostarsi ancora di più verso la qualità dell’orchestrazione, della sicurezza e dell’esperienza sviluppatore, piuttosto che verso la sola superiorità grezza del modello. Questa trasformazione ridisegna anche la gerarchia degli attori. I grandi laboratori mantengono il vantaggio della distribuzione, del capitale e dei migliori modelli, ma i fornitori di infrastruttura, gli editori di harness e le piattaforme di esecuzione recuperano una parte del potere. Quando l’esecuzione passa a sandbox terze, quando i tunnel di rete diventano un mattone critico, quando la manutenzione di una CLI conta quanto il modello sottostante per l’affidabilità quotidiana, il centro del sistema si allarga. I vincitori non saranno soltanto coloro che rispondono meglio a una domanda, ma coloro che si inseriscono nel modo più pulito in un’organizzazione già complessa. La cosa più sorprendente, in fondo, è il ritorno del banale. Un comando rinominato per inquadrare meglio la revisione del codice. Una sessione fissata che sopravvive a un aggiornamento. Una correzione Bash consegnata senza ritardo. Un benchmark che misura finalmente la proattività di un assistente visivo continuo. Sono dettagli, ma descrivono un’industria che comincia a lasciare la retorica della dimostrazione per entrare in quella dell’esercizio. È spesso in quel momento che un mercato diventa serio. La settimana trascorsa non ha dunque soltanto aggiunto alcuni prodotti a un elenco già lungo. Ha chiarito dove si giocherà la battaglia successiva. Non più unicamente sulla questione di sapere quale laboratorio produca il modello più impressionante, ma su quella, più concreta, di sapere quale ecosistema permetta a quel modello di lavorare durevolmente, in sicurezza e senza attriti. È un cambiamento meno spettacolare di un lancio di richiamo. È probabilmente più decisivo.Per on bel pez, el setor el s'ha poduu cuntalla come ona succession de grand svelament de modell. Ogni cicl el pareva dominà da ona domanda sempia: chi l'ha passaa la frontiera successiva? Questa setemana l'ha mostraa on'altra roba. I anunzi pussee strutturant no eran domà guadagn de score o contest pussee vast; i riguardavan i mezz per fà laurà i modell in ambient real. Quand Google el mett Gemini 3.5 Flash in evidenza e intant el collega a Antigravity, quand Anthropic el fa di sandbox auto-ospitaa e tunnel MCP ona estension de Claude, e quand OpenAI l'ufficializa Secure MCP Tunnel, el recònt dominant el cambia. El modell el resta la part maestra, ma no l'è pussee el prodott intier. Sto spostament el gh'ha ona logica economica ben netta. I modell, per quant differenzià i seghen, i diventan comparabil pussee in pressa che no le infrastrutture che ghe stann intorna. Invece, i cappe intermedie — CLI, session persistent, connettor MCP, profil de permess, arness d'esecuzion, supervision mobile, sandbox, access ai utij privaa — i crean abitudin, dipendenz e cost de migrazion ben pussee pesant. L'è lì che se costruissen i ver serradur de la prossima fasa. Ona impresa la pò arbitrà tra duu modell per on compit daa; la esitarà de pussee a rifà el sò mòdd de espon i sò utij intern, de governà i permess o d'osservà l'azion d'on agent in on terminal, on IDE e on navigador. L'è per quest che la standardizzazion implicita intorna a MCP la merita pussee attenzion che on benchmark isolaa. Google el la riconoss travers el mòdd in cui el descriv i sò modell e el sò utensilari. Anthropic el ne fa on canal operativ. OpenAI, sensa riprend propriamént el medem recònt, el tratta el problem visin: come collegà in manera netta i agent a sistem privaa sensa esponij. El tema de la setemana no l'è donca domà l'interoperabilità tecnica; l'è la nascida d'on terren comun de raccordament. Se questa capa la se stabiliza, i ses prossim mes podarian vedè la concorrenza spostass ancmò de pussee vers la qualità d'orchestrazion, de segurezz e d'esperienza sviluppador, pussee che vers la sola superiorità bruta del modell. Questa trasformazion la rimescia anca la gerarchia di ator. I grand laborator i tegnon el vantagg de la distribuzion, del capital e dei miglior modell, ma i fornitor d'infrastruttura, i editor d'arness e le piattaforme d'esecuzion i recuperan ona part del poder. Quand l'esecuzion la va in sandbox terz, quand i tunnel de rete i diventan on tòcch critic, quand la manutenzion d'ona CLI la conta tant quant el modell sottostant per l'affidabilità de ogni dì, el centr del sistema el s'allarga. I vincent no saran domà quij che risponden mei a ona domanda, ma quij che s'inserissen in la maniera pussee netta in d'ona organizazion già complessa. La roba pussee impressionanta, in fond, l'è el ritorno del banal. On comand rinominaa per inquadrà mei la revison del code. Ona session fissada che la sopraviv a on aggiornament. On correttiv Bash consegnaa sensa ritard. On benchmark che finalment el misura la proattività d'on assistent visual continu. Son dettagli, ma i descriven on'industria che la comenza a lassà la retorica de la dimostrazion per intrà in quella de l'esercizi operativ. Spess l'è propi in quel moment lì che on mercaa el diventa serii. La setemana passada no l'ha donca domà aggiuntaa quaj prodott a ona lista già longa. L'ha chiarì indoe se giugarà la battaglia successiva. No pussee unicament sora la domanda de savè qual laboratori el produus el modell pussee impressionant, ma sora quell'altra, pussee concreta, de savè qual ecosistema el permett a quel modell de laurà in manera duradura, segura e sensa frizion. L'è on cambiament manch spettacolar che on lanciament de punta. L'è probabilment pussee decisiv.