The Neuron Times

All the AI that's fit to print

N° 158 Édition du matinMorning EditionMorgenausgabeEdizione del mattinoEdizion del mattin · Genève DIMANCHE 7 JUIN 2026SUNDAY, 7 JUNE 2026SONNTAG, 7. JUNI 2026DOMENICA 7 GIUGNO 2026DOMENICA 7 GIUGNO 2026

À la Une · Guerre des talentsFront Page · Talent WarSchlagzeilen · Kampf um TalentePrima pagina · Guerra dei talentiIn prima pagina · Guerra di talent

Anthropic débauche le deuxième ingénieur puce d'OpenAI, les deux sociétés accélèrent vers leur IPOAnthropic poaches OpenAI's second-ever chip engineer as both companies race toward IPOsAnthropic wirbt zweiten Chip-Ingenieur von OpenAI ab – beide Unternehmen treiben Börsengang voranAnthropic sottrae il secondo ingegnere chip di OpenAI, entrambe le società accelerano verso l'IPOAnthropic el ghe porta via el segond ingegnee de chip d'OpenAI, i dò società corren vers la soa IPO

Clive Chan, deuxième employé du programme de puces sur mesure d'OpenAI, rejoint Anthropic alors que les deux entreprises se préparent à entrer en Bourse.Clive Chan, the second employee of OpenAI's custom chip program, joins Anthropic as both companies prepare to go public.Clive Chan, der zweite Mitarbeiter des Mass-Chip-Programms von OpenAI, wechselt zu Anthropic, während sich beide Firmen auf den Börsengang vorbereiten.Clive Chan, secondo dipendente del programma di chip su misura di OpenAI, passa ad Anthropic mentre entrambe le aziende si preparano a quotarsi in Borsa.Clive Chan, segond impiegaa del programma de chip sora misura d'OpenAI, el va dent in Anthropic intant che i dò aziende se preparen a andà in Borsa.

Clive Chan, qui se présente lui-même comme le deuxième employé du programme de puces sur mesure d'OpenAI, rejoint Anthropic, rapporte The Decoder. Chan apporte avec lui une expérience acquise chez Tesla sur l'ASIC Autopilot et au sein du partenariat OpenAI-Broadcom. Ce mouvement intervient alors que les deux entreprises accélèrent leurs préparatifs d'introduction en Bourse, et qu'Anthropic envisagerait de développer ses propres puces IA.Clive Chan, who describes himself as the second employee of OpenAI's custom chip program, is joining Anthropic, reports The Decoder. Chan brings experience from Tesla's Autopilot ASIC and the OpenAI-Broadcom partnership. The move comes as both companies accelerate their IPO preparations, and Anthropic is reportedly considering developing its own AI chips.Clive Chan, der sich selbst als zweiten Mitarbeiter des Mass-Chip-Programms von OpenAI bezeichnet, wechselt zu Anthropic, berichtet The Decoder. Chan bringt Erfahrung von Tesla am ASIC Autopilot sowie aus der Partnerschaft zwischen OpenAI und Broadcom mit. Dieser Schritt erfolgt, während beide Unternehmen ihre Vorbereitungen für den Börsengang beschleunigen und Anthropic eigenen Angaben nach die Entwicklung eigener KI-Chips erwägt.Clive Chan, che si presenta come il secondo dipendente del programma di chip su misura di OpenAI, passa ad Anthropic, riporta The Decoder. Chan porta con sé un'esperienza maturata in Tesla sull'ASIC Autopilot e all'interno della partnership OpenAI-Broadcom. Questo movimento avviene mentre entrambe le aziende accelerano i preparativi per l'IPO e Anthropic starebbe valutando di sviluppare propri chip IA.Clive Chan, che el se presenta lu istess come el segond impiegaa del programma de chip sora misura d'OpenAI, el va dent in Anthropic, el reporta The Decoder. Chan el porta con lu ona esperienza guadagnada in Tesla sora l'ASIC Autopilot e denter in del partenariad OpenAI-Broadcom. Sto moviment chì el riva intant che i dò aziende acceleren i sò preparativ per l'introduzzion in Borsa, e che Anthropic el pensaria de sviluppà i sò chip IA.

Le recrutement illustre la guerre des talents qui fait rage dans la Silicon Valley autour de l'infrastructure matérielle. Alors que la demande en calcul explose — le deal SpaceX-Google pour 110 000 puces Nvidia à 920 millions de dollars par mois en est la preuve la plus récente —, les labos frontière cherchent à internaliser la conception de silicium pour réduire leur dépendance aux fournisseurs externes.The hiring illustrates the fierce talent war raging in Silicon Valley over hardware infrastructure. As demand for compute explodes — the SpaceX-Google deal for 110,000 Nvidia chips at $920 million per month being the latest proof — frontier labs are seeking to internalize silicon design to reduce dependence on external suppliers.Die Abwerbung verdeutlicht den erbitterten Kampf um Talente im Silicon Valley im Bereich der Hardware-Infrastruktur. Während die Rechennachfrage explodiert – der SpaceX-Google-Deal über 110 000 Nvidia-Chips für 920 Millionen Dollar pro Monat ist der jüngste Beleg – versuchen die Frontier-Labore, das Silizium-Design zu internalisieren, um die Abhängigkeit von externen Zulieferern zu verringern.Il reclutamento illustra la guerra dei talenti in corso nella Silicon Valley attorno all'infrastruttura hardware. Mentre la domanda di potenza di calcolo esplode – l'accordo SpaceX-Google per 110.000 chip Nvidia a 920 milioni di dollari al mese ne è la prova più recente – i laboratori di frontiera cercano di internalizzare la progettazione del silicio per ridurre la dipendenza dai fornitori esterni.El reclutament el mostra la guerra di talent che la va in pee in de la Silicon Valley intorna a l'infrastruttura material. Intant che la domanda de calcol la s'ciopa — el deal SpaceX-Google per 110 000 chip Nvidia a 920 milion de dollar al mes l'è la prova pussee recenta —, i labò frontiera cerchen de internalizzà la progettazion del silicio per sbassà la dipendenza di fornidor de foeura.

Anthropic n'a pas commenté officiellement ce recrutement, mais la société a multiplié les embauches de haut niveau ces derniers mois. OpenAI, de son côté, poursuit le développement de son programme de puces internes, un projet stratégique pour réduire les coûts d'inférence qui pèsent lourdement sur ses marges.Anthropic has not officially commented on this hire, but the company has stepped up high-profile recruiting in recent months. OpenAI, for its part, continues to develop its internal chip program, a strategic project to reduce inference costs that weigh heavily on its margins.Anthropic hat sich zu dieser Einstellung offiziell nicht geäussert, doch das Unternehmen hat in den letzten Monaten zahlreiche Spitzenkräfte eingestellt. OpenAI seinerseits treibt die Entwicklung seines internen Chip-Programms voran, ein strategisches Projekt zur Senkung der Inferenzkosten, die schwer auf den Margen lasten.Anthropic non ha commentato ufficialmente questo reclutamento, ma la società ha moltiplicato le assunzioni di alto profilo negli ultimi mesi. OpenAI, dal canto suo, prosegue lo sviluppo del suo programma di chip interni, un progetto strategico per ridurre i costi di inferenza che pesano pesantemente sui suoi margini.Anthropic l'ha minga parlaa offizialment de sto reclutament, ma la società l'ha moltiplicaa i assunzion de alt nivell in di ultim mes. OpenAI, de la soa part, la va innanz cont el sviluppo del sò programma de chip intern, on progett strategich per sbassà i cost de inferenza che pesen fortement in su i sò margen.

Page 1 — Page 1 — Seite 1 — Pagina 1 — Pagina 1 — À la UneFront PageTitelgeschichteIn Primo PianoA la Prima

I. Modèles & FrontièreModels & FrontierModelle & FrontierModelli & FrontieraModèj & Frontiera

Nouveau modèle

New model

Neues Modell

Nuovo modello

Noeuv modèl

NVIDIA lance Nemotron 3.5 ASR, un modèle de reconnaissance vocale en temps réelNVIDIA launches Nemotron 3.5 ASR, a real-time speech recognition modelNVIDIA launcht Nemotron 3.5 ASR – Echtzeit-SpracherkennungsmodellNVIDIA lancia Nemotron 3.5 ASR, un modello di riconoscimento vocale in tempo realeNVIDIA el lanza Nemotron 3.5 ASR, on modèl de riconossiment vocal in temp real

NVIDIA a dévoilé Nemotron 3.5 ASR, un modèle de 600 millions de paramètres capable de transcrire 40 langues et variantes régionales en temps réel à partir d'un seul point de contrôle. Le modèle utilise une architecture « cache-aware » pour le streaming, détaille MarkTechPost. Une version gratuite est déjà disponible sur OpenRouter.
NVIDIA has unveiled Nemotron 3.5 ASR, a 600 million parameter model capable of transcribing 40 languages and regional variants in real time from a single checkpoint. The model uses a 'cache-aware' architecture for streaming, details MarkTechPost. A free version is already available on OpenRouter.
NVIDIA hat Nemotron 3.5 ASR vorgestellt, ein Modell mit 600 Millionen Parametern, das 40 Sprachen und regionale Varianten in Echtzeit aus einem einzigen Kontrollpunkt transkribieren kann. Das Modell verwendet eine «Cache-aware»-Architektur für Streaming, erläutert MarkTechPost. Eine kostenlose Version ist bereits auf OpenRouter verfügbar.
NVIDIA ha svelato Nemotron 3.5 ASR, un modello da 600 milioni di parametri in grado di trascrivere 40 lingue e varianti regionali in tempo reale a partire da un unico punto di controllo. Il modello utilizza un'architettura 'cache-aware' per lo streaming, dettaglia MarkTechPost. Una versione gratuita è già disponibile su OpenRouter.
NVIDIA l'ha svelaa Nemotron 3.5 ASR, on modèl de 600 milion de parametri bon de trascriver 40 lengov e variant regionai in temp real a partì de on sol pont de controll. El modèl el dòvra ona architettura « cache-aware » per el streaming, el detaja MarkTechPost. Ona version gratuita l'è già disponibil in su OpenRouter.

Open source

Open source

Open Source

Open source

Open source

Un nouveau modèle vocal open source écoute en continu et décide toutes les 0,4 secondesNew open source voice model listens continuously and decides every 0.4 secondsNeues Open-Source-Sprachmodell hört ununterbrochen zu und entscheidet alle 0,4 SekundenUn nuovo modello vocale open source ascolta in continuo e decide ogni 0,4 secondiOn noeuv modèl vocal open source el scolta in continov e el decid ogni 0,4 segond

Un nouveau modèle vocal open source baptisé « Audio Interaction » écoute en continu et décide toutes les 0,4 seconde s'il doit parler ou rester silencieux. Contrairement à GPT-4o ou Qwen3.5-Omni, il ne nécessite pas d'attendre la fin d'un enregistrement : il traduit, transcrit et dialogue en un seul flux, rapporte The Decoder. Le code et les poids sont disponibles sur GitHub sous licence Apache 2.0.
A new open source voice model called 'Audio Interaction' listens continuously and decides every 0.4 seconds whether to speak or stay silent. Unlike GPT-4o or Qwen3.5-Omni, it does not require waiting for a recording to finish: it translates, transcribes, and converses in a single stream, reports The Decoder. The code and weights are available on GitHub under the Apache 2.0 license.
Ein neues Open-Source-Sprachmodell namens «Audio Interaction» hört ununterbrochen zu und entscheidet alle 0,4 Sekunden, ob es sprechen oder schweigen soll. Anders als GPT-4o oder Qwen3.5-Omni muss es nicht auf das Ende einer Aufnahme warten: Es übersetzt, transkribiert und dialogisiert in einem einzigen Datenstrom, berichtet The Decoder. Code und Gewichte sind auf GitHub unter der Apache-2.0-Lizenz verfügbar.
Un nuovo modello vocale open source chiamato 'Audio Interaction' ascolta in continuo e decide ogni 0,4 secondi se parlare o rimanere in silenzio. A differenza di GPT-4o o Qwen3.5-Omni, non richiede di attendere la fine di una registrazione: traduce, trascrive e dialoga in un unico flusso, riporta The Decoder. Il codice e i pesi sono disponibili su GitHub con licenza Apache 2.0.
On noeuv modèl vocal open source ciamaa « Audio Interaction » el scolta in continov e el decid ogni 0,4 segond se l'ha de parlà o restà in silenzi. Al contrari de GPT-4o o Qwen3.5-Omni, el gh'ha minga besogn de spettà la fin d'on registrazion: el tradus, el trascriv e el dialoga in d'on sol fluss, el reporta The Decoder. El codes e i pes hinn disponibil in su GitHub sotta licenza Apache 2.0.

Recherche

Research

Forschung

Ricerca

Ricerca

Des chercheurs identifient pourquoi les grands modèles linguistiques acquièrent des compétences que les petits ratentResearchers pinpoint why large language models acquire skills that small ones missForscher identifizieren, warum grosse Sprachmodelle Fähigkeiten erwerben, die kleinen entgehenRicercatori identificano perché i grandi modelli linguistici acquisiscono competenze che i piccoli perdonoDi cercador identifiquen perchè i grand modèj lenguistegh ciapànn di competenze che i piscininn perden

Une étude portant sur des modèles de 4 millions à 4 milliards de paramètres montre que les petits modèles échouent sur des tâches rares parce que les tâches fréquentes écrasent en permanence ce qu'ils ont appris. Les chercheurs proposent une solution pratique : plutôt que d'augmenter la taille du modèle, il suffirait d'augmenter la fréquence d'apparition de la tâche cible dans les données d'entraînement, rapporte The Decoder.
A study of models ranging from 4 million to 4 billion parameters shows that small models fail on rare tasks because frequent tasks constantly overwrite what they have learned. The researchers propose a practical solution: rather than increasing model size, simply increasing the frequency of the target task in the training data suffices, reports The Decoder.
Eine Studie mit Modellen von 4 Millionen bis 4 Milliarden Parametern zeigt, dass kleine Modelle bei seltenen Aufgaben versagen, weil häufige Aufgaben das Gelernte ständig überschreiben. Die Forscher schlagen eine praktische Lösung vor: Statt die Modellgrösse zu erhöhen, genüge es, die Auftrittshäufigkeit der Zielaufgabe in den Trainingsdaten zu erhöhen, berichtet The Decoder.
Uno studio su modelli da 4 milioni a 4 miliardi di parametri mostra che i modelli piccoli falliscono su compiti rari perché i compiti frequenti sovrascrivono permanentemente ciò che hanno appreso. I ricercatori propongono una soluzione pratica: invece di aumentare la dimensione del modello, basterebbe aumentare la frequenza di comparsa del compito target nei dati di addestramento, riporta The Decoder.
On studi sora di modèj de 4 milion a 4 miliard de parametri el mostra che i modèj piscininn fallissen in di compit rar perchè i compit frequent s'ciancen in manera permanent quell che hann imparaa. I cercador proponen ona soluzion pratica: inveci de aumentà la grandezza del modèl, el basteria aumentà la frequenza de comparsa del compit obietiv in di dat de addestrament, el reporta The Decoder.

Page 2 — Page 2 — Seite 2 — Pagina 2 — Pagina 2 — Le Cahier TechniqueTech NotebookTechnisches HeftIl Quaderno TecnicoEl Quadern Tecnegh

II. CLI & HarnessesCLI & HarnessesCLI & HarnessesCLI & HarnessesCLI & Harnesses

Claude Code

Claude Code

Claude Code

Claude Code

Claude Code

Claude Code v2.1.166 introduit le fallback multi-modèle et le support des glob patternsClaude Code v2.1.166 introduces multi-model fallback and glob pattern supportClaude Code v2.1.166 führt Multi-Modell-Fallback und Glob-Pattern-Unterstützung einClaude Code v2.1.166 introduce il fallback multi-modello e il supporto per i glob patternsClaude Code v2.1.166 el introdux el fallback multi-modèl e el support di glob patterns

La version 2.1.166 de Claude Code, publiée le 6 juin, ajoute un paramètre fallbackModel permettant de configurer jusqu'à trois modèles de repli lorsque le modèle principal est saturé ou indisponible. Le flag --fallback-model s'applique désormais aussi aux sessions interactives. La mise à jour introduit également le support des glob patterns dans les règles de refus d'outils, et renforce la sécurité des messages inter-sessions, détaille la release note.
Claude Code version 2.1.166, released on June 6, adds a fallbackModel parameter allowing configuration of up to three fallback models when the primary model is saturated or unavailable. The --fallback-model flag now also applies to interactive sessions. The update also introduces glob pattern support in tool refusal rules and strengthens inter-session message security, details the release note.
Die am 6. Juni veröffentlichte Version 2.1.166 von Claude Code fügt einen Parameter fallbackModel hinzu, mit dem bis zu drei Ersatzmodelle konfiguriert werden können, wenn das Hauptmodell ausgelastet oder nicht verfügbar ist. Das Flag --fallback-model gilt nun auch für interaktive Sitzungen. Das Update führt zudem die Unterstützung von Glob-Patterns in den Regeln zur Tool-Ablehnung ein und verstärkt die Sicherheit von Nachrichten zwischen Sitzungen, erläutert der Release-Hinweis.
La versione 2.1.166 di Claude Code, pubblicata il 6 giugno, aggiunge un parametro fallbackModel che consente di configurare fino a tre modelli di riserva quando il modello principale è saturo o non disponibile. Il flag --fallback-model si applica ora anche alle sessioni interattive. L'aggiornamento introduce inoltre il supporto per i glob patterns nelle regole di rifiuto degli strumenti e rafforza la sicurezza dei messaggi tra sessioni, dettaglia la release note.
La version 2.1.166 de Claude Code, publicada el 6 de sgiugn, la gionta on parametro fallbackModel che el permet de configurà fina a trii modèj de repli quand che el modèl principal l'è satur o minga disponibil. El flag --fallback-model el se applica adess anca ai session interativ. La modifega la introdux anca el support di glob patterns in di regol de refud di strument, e la rinforza la sigurezza di messagg inter-session, la detaja la release note.

Google Colab

Google Colab

Google Colab

Google Colab

Google Colab

Google lance un CLI Colab pour exécuter du Python sur GPU/TPU distant depuis le terminalGoogle launches Colab CLI to run Python on remote GPU/TPU from the terminalGoogle launcht Colab CLI zur Ausführung von Python auf entfernten GPUs/TPUs via TerminalGoogle lancia un CLI Colab per eseguire Python su GPU/TPU remoto dal terminaleGoogle el lanza on CLI Colab per eseguì Python in su GPU/TPU distant del terminal

Google a publié le Colab CLI, qui permet aux développeurs et aux agents IA d'exécuter du code local sur des runtimes GPU et TPU Colab distants depuis le terminal, rapporte MarkTechPost. L'outil ouvre la voie à des workflows d'entraînement et d'inférence légers sans nécessiter d'infrastructure cloud dédiée.
Google has released the Colab CLI, which allows developers and AI agents to run local code on remote Colab GPU and TPU runtimes from the terminal, reports MarkTechPost. The tool paves the way for lightweight training and inference workflows without requiring dedicated cloud infrastructure.
Google hat das Colab CLI veröffentlicht, das Entwicklern und KI-Agenten ermöglicht, lokalen Code auf entfernten Colab-GPU- und TPU-Laufzeiten vom Terminal aus auszuführen, berichtet MarkTechPost. Das Tool ebnet den Weg für leichte Trainings- und Inferenz-Workflows ohne dedizierte Cloud-Infrastruktur.
Google ha pubblicato il Colab CLI, che consente a sviluppatori e agenti IA di eseguire codice locale su runtime GPU e TPU Colab remoti dal terminale, riporta MarkTechPost. Lo strumento apre la strada a workflow di addestramento e inferenza leggeri senza richiedere infrastruttura cloud dedicata.
Google l'ha publicaa el Colab CLI, che el permet ai sviluppador e ai agent IA de eseguì codes local in su runtime GPU e TPU Colab distant del terminal, el reporta MarkTechPost. L'utensil el derva la via a di fluss de lavorà de addestrament e inferenza lenger senza besogn de infrastruttura cloud dedicada.

Kimi Code

Kimi Code

Kimi Code

Kimi Code

Kimi Code

Moonshot AI publie Kimi Code CLI, un agent de codage open source en TypeScriptMoonshot AI releases Kimi Code CLI, an open source coding agent in TypeScriptMoonshot AI veröffentlicht Kimi Code CLI – Open-Source-Coding-Agent in TypeScriptMoonshot AI pubblica Kimi Code CLI, un agente di codifica open source in TypeScriptMoonshot AI el publica Kimi Code CLI, on agent de codifega open source in TypeScript

Moonshot AI a publié Kimi Code CLI, un agent de codage en terminal open source écrit en TypeScript, doté de sous-agents et d'une configuration MCP, rapporte MarkTechPost. L'outil s'inscrit dans la vague des coding agents en ligne de commande, aux côtés de Claude Code et Codex.
Moonshot AI has released Kimi Code CLI, an open source terminal coding agent written in TypeScript, featuring sub-agents and MCP configuration, reports MarkTechPost. The tool joins the wave of command-line coding agents alongside Claude Code and Codex.
Moonshot AI hat Kimi Code CLI veröffentlicht, einen Open-Source-Terminal-Coding-Agent in TypeScript mit Unteragenten und MCP-Konfiguration, berichtet MarkTechPost. Das Tool reiht sich in die Welle der Coding-Agenten für die Kommandozeile ein, neben Claude Code und Codex.
Moonshot AI ha pubblicato Kimi Code CLI, un agente di codifica da terminale open source scritto in TypeScript, dotato di sotto-agenti e configurazione MCP, riporta MarkTechPost. Lo strumento si inserisce nell'ondata degli agenti di codifica a riga di comando, accanto a Claude Code e Codex.
Moonshot AI l'ha publicaa Kimi Code CLI, on agent de codifega in terminal open source scrivuu in TypeScript, dotaa de sotto-agent e d'ona configurazion MCP, el reporta MarkTechPost. L'utensil el se met in de l'onda di coding agent in linia de comand, arent a Claude Code e Codex.

III. Engines & InfraEngines & InfraEngines & InfraEngines & InfraEngines & Infra

oMLX

oMLX

oMLX

oMLX

oMLX

oMLX 0.4.2rc1 améliore le support multimodal de Gemma 4 et le débit de QwenoMLX 0.4.2rc1 improves Gemma 4 multimodal support and Qwen throughputoMLX 0.4.2rc1 verbessert multimodale Unterstützung von Gemma 4 und Durchsatz von QwenoMLX 0.4.2rc1 migliora il supporto multimodale di Gemma 4 e il throughput di QwenoMLX 0.4.2rc1 el miora el support multimodal de Gemma 4 e el débit de Qwen

La release candidate 0.4.2rc1 d'oMLX, publiée le 6 juin, apporte le traitement natif de documents via MarkItDown (PDF, DOCX, PPTX), le support audio unifié pour Gemma 4, et un gain de débit de 1,48x pour les modèles Qwen après une régression dans la version 0.4.0. La mise à jour inclut également une politique de fenêtre de contexte à l'échelle du serveur et de nombreuses corrections de stabilité, détaille la release note.
oMLX release candidate 0.4.2rc1, published on June 6, brings native document processing via MarkItDown (PDF, DOCX, PPTX), unified audio support for Gemma 4, and a 1.48x throughput gain for Qwen models following a regression in version 0.4.0. The update also includes a server-wide context window policy and numerous stability fixes, details the release note.
Die am 6. Juni veröffentlichte Release Candidate 0.4.2rc1 von oMLX bringt native Dokumentenverarbeitung via MarkItDown (PDF, DOCX, PPTX), einheitliche Audio-Unterstützung für Gemma 4 und einen Durchsatzgewinn von 1,48x für Qwen-Modelle nach einer Regression in Version 0.4.0. Das Update enthält zudem eine kontextfensterbezogene Richtlinie auf Serverebene und zahlreiche Stabilitätskorrekturen, erläutert der Release-Hinweis.
La release candidate 0.4.2rc1 di oMLX, pubblicata il 6 giugno, porta l'elaborazione nativa di documenti tramite MarkItDown (PDF, DOCX, PPTX), il supporto audio unificato per Gemma 4 e un guadagno di throughput di 1,48x per i modelli Qwen dopo una regressione nella versione 0.4.0. L'aggiornamento include anche una politica di finestra di contesto a livello di server e numerose correzioni di stabilità, dettaglia la release note.
La release candidate 0.4.2rc1 d'oMLX, publicada el 6 de sgiugn, la porta el trattament nativ de document via MarkItDown (PDF, DOCX, PPTX), el support audio unificaa per Gemma 4, e on guadagn de débit de 1,48x per i modèj Qwen dopo d'ona regression in de la version 0.4.0. La modifega la includ anca ona politega de finestra de contest a scala del server e tante correzion de stabilità, la detaja la release note.

Page 3 — Page 3 — Seite 3 — Pagina 3 — Pagina 3 — La RechercheResearchForschungLa RicercaLa Ricerca

IV. Papers & LabosPapers & LabsPapers & LaborePapers & LabosPapers & Labò

Recherche

Research

Forschung

Ricerca

Ricerca

Harness-1 : un sous-agent de recherche 20B entraîné par renforcement dans un harnais d'étatHarness-1: a 20B retrieval subagent trained with reinforcement learning inside a stateful harnessHarness-1: Ein 20B-Recherche-Subagent, trainiert durch verstärkendes Lernen in einem zustandsbehafteten HarnessHarness-1: un sotto-agente di recupero da 20B addestrato con rinforzo in un'imbracatura di statoHarness-1: on sotto-agent de ricerca 20B addestrad per rinforzament in d'on harnes de stat

Des chercheurs de l'UIUC et de Chroma présentent Harness-1, un sous-agent de recherche de 20 milliards de paramètres entraîné par apprentissage par renforcement dans un harnais de recherche avec état. Le système atteint un score de 0,730 de rappel moyen sur huit benchmarks, battant le meilleur sous-agent open source de 11,4 points et ne cédant que devant Opus-4.6, rapporte MarkTechPost. Les poids et le code du harnais sont publiés.
Researchers from UIUC and Chroma present Harness-1, a 20 billion parameter retrieval subagent trained with reinforcement learning inside a stateful search harness. The system achieves a mean recall score of 0.730 across eight benchmarks, beating the best open source subagent by 11.4 points and yielding only to Opus-4.6, reports MarkTechPost. The weights and harness code are published.
Forscher der UIUC und von Chroma präsentieren Harness-1, einen 20 Milliarden Parameter umfassenden Recherche-Subagenten, der durch verstärkendes Lernen in einem zustandsbehafteten Such-Harness trainiert wurde. Das System erreicht einen durchschnittlichen Recall-Wert von 0,730 über acht Benchmarks, übertrifft den besten Open-Source-Subagenten um 11,4 Punkte und unterliegt nur Opus-4.6, berichtet MarkTechPost. Die Gewichte und der Code des Harness sind veröffentlicht.
Ricercatori dell'UIUC e di Chroma presentano Harness-1, un sotto-agente di recupero da 20 miliardi di parametri addestrato tramite apprendimento per rinforzo in un'imbracatura di ricerca con stato. Il sistema raggiunge un punteggio di 0,730 di richiamo medio su otto benchmark, superando il miglior sotto-agente open source di 11,4 punti e cedendo solo davanti a Opus-4.6, riporta MarkTechPost. I pesi e il codice dell'imbracatura sono pubblicati.
Di cercador de l'UIUC e de Chroma presenten Harness-1, on sotto-agent de ricerca de 20 miliard de parametri addestrad per apprendiment per rinforzament in d'on harnes de ricerca con stat. El sistema el riva a on score de 0,730 de richiam medi in su vòtt benchmark, el bat el miglior sotto-agent open source de 11,4 pont e el cede domà denanz a Opus-4.6, el reporta MarkTechPost. I pes e 'l codes del harnes hinn publicaa.

Perplexity

Perplexity

Perplexity

Perplexity

Perplexity

Perplexity dévoile « Search as Code » : les modèles IA écrivent leurs propres pipelines de recherchePerplexity unveils 'Search as Code': AI models write their own search pipelinesPerplexity enthüllt «Search as Code»: KI-Modelle schreiben ihre eigenen Such-PipelinesPerplexity svela 'Search as Code': i modelli IA scrivono le proprie pipeline di ricercaPerplexity el svela « Search as Code »: i modèj IA scriven i sò pipeline de ricerca

Perplexity a dévoilé une nouvelle architecture « Search as Code » qui abandonne les API de recherche rigides et permet aux modèles IA d'écrire leurs propres routines de recherche en Python. En laissant l'agent gérer son propre filtrage et déduplication dans un sandbox, le système surpasse OpenAI et Anthropic sur des benchmarks clés tout en réduisant les coûts de tokens jusqu'à 85 %, rapporte The Decoder.
Perplexity has unveiled a new 'Search as Code' architecture that abandons rigid search APIs and allows AI models to write their own search routines in Python. By letting the agent handle its own filtering and deduplication in a sandbox, the system outperforms OpenAI and Anthropic on key benchmarks while reducing token costs by up to 85%, reports The Decoder.
Perplexity hat eine neue Architektur namens «Search as Code» vorgestellt, die starre Such-APIs aufgibt und KI-Modellen erlaubt, ihre eigenen Suchroutinen in Python zu schreiben. Indem der Agent sein eigenes Filtern und Deduplizieren in einer Sandbox verwaltet, übertrifft das System OpenAI und Anthropic bei wichtigen Benchmarks und senkt gleichzeitig die Token-Kosten um bis zu 85 Prozent, berichtet The Decoder.
Perplexity ha svelato una nuova architettura 'Search as Code' che abbandona le API di ricerca rigide e consente ai modelli IA di scrivere le proprie routine di ricerca in Python. Lasciando che l'agente gestisca il proprio filtraggio e deduplicazione in un sandbox, il sistema supera OpenAI e Anthropic su benchmark chiave riducendo al contempo i costi di token fino all'85%, riporta The Decoder.
Perplexity l'ha svelaa ona noeuva architettura « Search as Code » che la bandona i API de ricerca rigid e la permet ai modèj IA de scriv i sò routine de ricerca in Python. Lassand che l'agent el gestissa el sò propri filtrazion e deduplicazion in d'on sandbox, el sistema el supera OpenAI e Anthropic in su di benchmark ciav intant che el sbassa i cost de token fina a l'85%, el reporta The Decoder.

NVIDIA

NVIDIA

NVIDIA

NVIDIA

NVIDIA

NVIDIA publie un tutoriel complet pour le red-teaming défensif des LLM avec GarakNVIDIA publishes comprehensive tutorial for defensive LLM red-teaming with GarakNVIDIA veröffentlicht umfassendes Tutorial für defensives Red-Teaming von LLMs mit GarakNVIDIA pubblica un tutorial completo per il red-teaming difensivo dei LLM con GarakNVIDIA el publica on tutorijal complet per el red-teaming defensiv di LLM con Garak

NVIDIA a publié un tutoriel complet pour Garak, un framework de red-teaming défensif pour LLM. Le guide couvre l'installation, la découverte de plugins, les scans sur modèle réel via un générateur Hugging Face, et l'extension de Garak avec des sondes et détecteurs personnalisés, rapporte MarkTechPost. Les résultats peuvent être exportés au format AVID pour une gestion structurée des vulnérabilités.
NVIDIA has published a comprehensive tutorial for Garak, a defensive red-teaming framework for LLMs. The guide covers installation, plugin discovery, scans on real models via a Hugging Face generator, and extending Garak with custom probes and detectors, reports MarkTechPost. Results can be exported in AVID format for structured vulnerability management.
NVIDIA hat ein umfassendes Tutorial für Garak veröffentlicht, ein Framework für defensives Red-Teaming von LLMs. Der Leitfaden behandelt Installation, Plugin-Erkennung, Scans auf echten Modellen via Hugging-Face-Generator sowie die Erweiterung von Garak mit benutzerdefinierten Sonden und Detektoren, berichtet MarkTechPost. Die Ergebnisse können im AVID-Format für eine strukturierte Schwachstellenverwaltung exportiert werden.
NVIDIA ha pubblicato un tutorial completo per Garak, un framework di red-teaming difensivo per LLM. La guida copre l'installazione, la scoperta di plugin, le scansioni su modello reale tramite un generatore Hugging Face e l'estensione di Garak con sonde e rilevatori personalizzati, riporta MarkTechPost. I risultati possono essere esportati in formato AVID per una gestione strutturata delle vulnerabilità.
NVIDIA l'ha publicaa on tutorijal complet per Garak, on framework de red-teaming defensiv per LLM. La guida la quata l'installazion, la descoverta di plugin, i scan in su modèl real via on generator Hugging Face, e l'estension de Garak con di sond e detector personalizzaa, el reporta MarkTechPost. I resultad pòden vess esportaa al formad AVID per ona gestion strutturada di vulnerabilità.

Page 4 — Page 4 — Seite 4 — Pagina 4 — Pagina 4 — La Communauté & ÉditoCommunity & EditorialCommunity & EditorialLa Comunità & EditorialeLa Comunità & Editorijal

V. Signaux de la communautéCommunity SignalsSignale aus der CommunitySegnali dalla comunitàSegnai de la comunità

Open source

Open source

Open Source

Open source

Open source

Cohere dévoile en avant-première son premier modèle de codage sur r/LocalLLaMACohere previews its first coding model on r/LocalLLaMACohere zeigt erstes Coding-Modell vorab auf r/LocalLLaMACohere svela in anteprima il suo primo modello di codifica su r/LocalLLaMACohere el svela in anteprima el sò prim modèl de codifega in su r/LocalLLaMA

Nick de Cohere a annoncé sur r/LocalLLaMA que la société prépare son premier modèle de codage et offre à la communauté l'opportunité de le tester en avant-première avant la sortie officielle. Une démarche inédite pour Cohere, qui sollicite directement les retours des utilisateurs locaux.
Nick from Cohere announced on r/LocalLLaMA that the company is preparing its first coding model and is offering the community an opportunity to test it early before the official release. An unprecedented move for Cohere, which is directly soliciting feedback from local users.
Nick von Cohere hat auf r/LocalLLaMA angekündigt, dass das Unternehmen sein erstes Coding-Modell vorbereitet und der Community die Möglichkeit bietet, es vor der offiziellen Veröffentlichung vorab zu testen. Ein ungewöhnlicher Schritt für Cohere, das direkt das Feedback lokaler Nutzer einholt.
Nick di Cohere ha annunciato su r/LocalLLaMA che la società sta preparando il suo primo modello di codifica e offre alla comunità l'opportunità di testarlo in anteprima prima del rilascio ufficiale. Un'iniziativa inedita per Cohere, che sollecita direttamente i feedback degli utenti locali.
Nick de Cohere l'ha anunziaa in su r/LocalLLaMA che la società la prepara el sò prim modèl de codifega e la ghe offr a la comunità l'opportunità de provàll in anteprima prima de la sortida offizial. Ona démarzia inedita per Cohere, che la domanda direttament i retorn di utent locai.

Infrastructure

Infrastructure

Infrastruktur

Infrastruttura

Infrastruttura

SourceHut perturbé par des crawlers LLMSourceHut disrupted by LLM crawlersSourceHut durch LLM-Crawler gestörtSourceHut perturbato da crawler LLMSourceHut perturbad di crawler LLM

La plateforme de développement SourceHut a subi des perturbations importantes causées par des crawlers de modèles de langage, selon leur rapport d'incident. L'événement relance le débat sur l'impact des robots d'indexation IA sur les infrastructures open source, avec 7 points et 2 commentaires sur Hacker News.
The SourceHut development platform suffered significant disruptions caused by language model crawlers, according to their incident report. The event reignites debate over the impact of AI indexing bots on open source infrastructure, with 7 points and 2 comments on Hacker News.
Die Entwicklungsplattform SourceHut hat erhebliche Störungen durch Crawler von Sprachmodellen erlitten, wie aus ihrem Incident-Bericht hervorgeht. Der Vorfall entfacht die Debatte über die Auswirkungen von KI-Indexierungsrobotern auf Open-Source-Infrastrukturen neu, mit 7 Punkten und 2 Kommentaren auf Hacker News.
La piattaforma di sviluppo SourceHut ha subito perturbazioni significative causate da crawler di modelli linguistici, secondo il loro rapporto d'incidente. L'evento riapre il dibattito sull'impatto dei robot di indicizzazione IA sulle infrastrutture open source, con 7 punti e 2 commenti su Hacker News.
La piattaforma de sviluppo SourceHut l'ha subii di perturbazion important causad di crawler de modèj de lenguagg, segond el sò rapport d'incident. L'eveniment el tacca su el debatt in su l'impatt di robot de indicizion IA in su di infrastruttur open source, con 7 pont e 2 coment in su Hacker News.

Meta

Meta

Meta

Meta

Meta

Meta prépare un agent IA payant « Hatch » à 200 dollars par moisMeta prepares paid AI agent 'Hatch' at $200 per monthMeta bereitet kostenpflichtigen KI-Agenten «Hatch» für 200 Dollar pro Monat vorMeta prepara un agente IA a pagamento 'Hatch' a 200 dollari al meseMeta el prepara on agent IA pagament « Hatch » a 200 dollar al mes

Meta développe un produit d'agent IA payant baptisé « Hatch » qui pourrait coûter jusqu'à 200 dollars par mois, rapporte The Decoder. Les utilisateurs décrivent leurs besoins en langage naturel, et Hatch construit des outils fonctionnels, planifie des rendez-vous ou envoie des emails. Mark Zuckerberg voit ce produit comme un moyen d'ouvrir de nouvelles sources de revenus au-delà de la publicité.
Meta is developing a paid AI agent product called 'Hatch' that could cost up to $200 per month, reports The Decoder. Users describe their needs in natural language, and Hatch builds functional tools, schedules appointments, or sends emails. Mark Zuckerberg sees this product as a way to open new revenue streams beyond advertising.
Meta entwickelt ein kostenpflichtiges KI-Agenten-Produkt namens «Hatch», das bis zu 200 Dollar pro Monat kosten könnte, berichtet The Decoder. Die Nutzer beschreiben ihre Bedürfnisse in natürlicher Sprache, und Hatch erstellt funktionale Werkzeuge, plant Termine oder versendet E-Mails. Mark Zuckerberg sieht in diesem Produkt eine Möglichkeit, neue Einnahmequellen jenseits der Werbung zu erschliessen.
Meta sta sviluppando un prodotto agente IA a pagamento chiamato 'Hatch' che potrebbe costare fino a 200 dollari al mese, riporta The Decoder. Gli utenti descrivono le loro esigenze in linguaggio naturale e Hatch costruisce strumenti funzionali, pianifica appuntamenti o invia email. Mark Zuckerberg vede questo prodotto come un modo per aprire nuove fonti di reddito oltre la pubblicità.
Meta el sviluppa on prodott d'agent IA pagament ciamaa « Hatch » che el podaria costà fina a 200 dollar al mes, el reporta The Decoder. I utent descriven i sò besogn in lenguagg natural, e Hatch el costruiss di strument fonzionai, el planifica di appuntament o el manda di email. Mark Zuckerberg el ved sto prodott come on moeud de dervì di noeuve sorgent de intrada oltra la publicità.

VI. ÉditoEditorialEditorialEditorialeEditorijal

Éditorial

Editorial

Leitartikel

Editoriale

Editorijal

La guerre des talents s'étend au siliciumThe talent war extends to siliconDer Kampf um Talente erstreckt sich auf SiliziumLa guerra dei talenti si estende al silicioLa guerra di talent la se slarga al silicio

Le départ de Clive Chan d'OpenAI vers Anthropic n'est pas un simple mouvement de personnel. C'est le signe que la bataille de l'IA se déplace des modèles vers le matériel. Alors que les coûts d'inférence explosent — le deal SpaceX-Google à 920 millions de dollars par mois en est l'illustration la plus frappante —, chaque laboratoire veut contrôler sa propre chaîne de calcul. Anthropic, OpenAI, Google, tous investissent dans le silicium sur mesure. La question n'est plus de savoir quel modèle est le plus performant, mais qui contrôlera les puces qui les font tourner. Dans cette course, les talents sont la ressource la plus rare. Et comme le montre le recrutement de Chan, ils sont prêts à traverser la rue pour le bon projet.
Clive Chan's departure from OpenAI to Anthropic is not a simple personnel move. It is a sign that the AI battle is shifting from models to hardware. As inference costs skyrocket — the SpaceX-Google deal at $920 million per month being the most striking illustration — every lab wants to control its own compute chain. Anthropic, OpenAI, Google — all are investing in custom silicon. The question is no longer which model is the most capable, but who will control the chips that power them. In this race, talent is the scarcest resource. And as Chan's recruitment shows, they are ready to cross the street for the right project.
Der Weggang von Clive Chan von OpenAI zu Anthropic ist kein einfacher Personalwechsel. Er ist ein Zeichen dafür, dass sich der Kampf um KI von den Modellen auf die Hardware verlagert. Während die Inferenzkosten explodieren – der SpaceX-Google-Deal über 920 Millionen Dollar pro Monat ist das eindrücklichste Beispiel – will jedes Labor seine eigene Rechenkette kontrollieren. Anthropic, OpenAI, Google – alle investieren in massgeschneidertes Silizium. Die Frage ist nicht mehr, welches Modell das leistungsfähigste ist, sondern wer die Chips kontrolliert, die sie antreiben. In diesem Wettlauf sind Talente die knappste Ressource. Und wie die Einstellung von Chan zeigt, sind sie bereit, für das richtige Projekt die Strasse zu überqueren.
La partenza di Clive Chan da OpenAI verso Anthropic non è un semplice movimento di personale. È il segno che la battaglia dell'IA si sposta dai modelli all'hardware. Mentre i costi di inferenza esplodono – l'accordo SpaceX-Google da 920 milioni di dollari al mese ne è l'illustrazione più eclatante – ogni laboratorio vuole controllare la propria catena di calcolo. Anthropic, OpenAI, Google, tutti investono nel silicio su misura. La questione non è più sapere quale modello sia il più performante, ma chi controllerà i chip che li fanno funzionare. In questa corsa, i talenti sono la risorsa più rara. E come mostra il reclutamento di Chan, sono pronti ad attraversare la strada per il progetto giusto.
El partì de Clive Chan d'OpenAI vers Anthropic l'è minga on sempliz moviment de personal. L'è 'l segn che la bataja de l'IA la se sposta di modèj vers el material. Intant che i cost de inferenza s'ciopen — el deal SpaceX-Google a 920 milion de dollar al mes l'è l'ilustrazion pussee frappanta —, ogni laboratori el voeur controllà la soa propia cadena de calcol. Anthropic, OpenAI, Google, tucc investen in del silicio sora misura. La question l'è pu de savè quell modèl l'è el pussee performant, ma chi che el controlarà i chip che i fann fonzionà. In sta corsa chì, i talent hinn la risorsa pussee rara. E come el mostra el reclutament de Chan, hinn pront a traversà la strada per el progett giust.