À la Une · Modèles & FrontièreFront Page · Models & FrontierAuf der Titelseite · Modelle & GrenzenPrima pagina · Modelli e FrontieraIn Prima Pagina · Modell e Frontiera
Claude Mythos résout un problème légendaire d'Erdős, ravivant le débat sur les capacités mathématiques de l'IAClaude Mythos solves a legendary Erdős problem, reigniting the debate over AI's mathematical abilitiesClaude Mythos löst ein legendäres Erdős-Problem und entfacht Debatte über mathematische Fähigkeiten der KIClaude Mythos risolve un problema leggendario di Erdős, riaccendendo il dibattito sulle capacità matematiche dell'IAClaude Mythos l'ha risolt on problema legendari de Erdős, rilanciand el debatt sula capacità matematich de l'IA
Quelques jours après qu'OpenAI a réfuté la conjecture d'Erdős sur les distances unitaires, Anthropic affirme que son modèle Mythos a trouvé une preuve élégante du problème original — un résultat qui interroge la frontière entre découverte et imitation.Days after OpenAI refuted the Erdős unit-distance conjecture, Anthropic claims its model Mythos found an elegant proof of the original problem — a result that raises questions about the boundary between discovery and imitation.Wenige Tage nachdem OpenAI die Erdős-Vermutung über Einheitsdistanzen widerrief, behauptet Anthropic, dass sein Mythos-Modell einen eleganten Beweis für das ursprüngliche Problem gefunden hat – ein Ergebnis, das die Grenze zwischen Entdeckung und Nachahmung infrage stellt.Pochi giorni dopo che OpenAI ha smentito la congettura di Erdős sulle distanze unitarie, Anthropic afferma che il suo modello Mythos ha trovato una dimostrazione elegante del problema originale — un risultato che interroga la frontiera tra scoperta e imitazione.Poeu dì dop che l'OpenAI l'ha refutaa la congettura de Erdős sui distanz unitari, l'Afferma che sò modell Mythos l'ha trovaa ona dimostrazion eleganta del problema original — un resultad che interoga la frontiera tra scoverta e imitazion.
De la rédaction — 27 mai 2026From the newsroom — 27 May 2026Von der Redaktion — 27. Mai 2026Dalla redazione — 27 maggio 2026De la redazion — 27 magg 2026
La guerre des modèles mathématiques a pris un tour inattendu. Alors qu'OpenAI venait de publier une réfutation de la conjecture d'Erdős sur les distances unitaires — un problème ouvert depuis 1946 —, The Decoder rapporte qu'Anthropic affirme que son modèle Claude Mythos a résolu le problème original « le week-end dernier », avec ce que l'ingénieur Sholto Douglas qualifie de « preuve mignonne et simple ».The battle of mathematical models has taken an unexpected turn. Just after OpenAI published a refutation of the Erdős unit-distance conjecture — a problem open since 1946 — The Decoder reports that Anthropic claims its model Claude Mythos solved the original problem "last weekend" with what engineer Sholto Douglas calls a "cute, simple proof."Der Krieg der mathematische Modelle hat eine unerwartete Wendung genommen. Während OpenAI gerade eine Widerlegung der Erdős-Vermutung über Einheitsdistanzen publiziert hatte – ein Problem, das seit 1946 offen war –, berichtet The Decoder, dass Anthropic behauptet, sein Claude-Mythos-Modell habe das ursprüngliche Problem « am vergangenen Wochenende » mit einem, wie Ingenieur Sholto Douglas sagt, « niedlichen und einfachen Beweis » gelöst.La guerra dei modelli matematici ha preso una svolta inaspettata. Mentre OpenAI aveva appena pubblicato una smentita della congettura di Erdős sulle distanze unitarie — un problema aperto dal 1946 —, The Decoder riferisce che Anthropic afferma che il suo modello Claude Mythos ha risolto il problema originale «lo scorso fine settimana», con ciò che l'ingegnere Sholto Douglas definisce una «dimostrazione carina e semplice».La guerra di modell matematich l'ha pigiaa un gir inaspettat. Mentre l'OpenAI l'aveva appena publicaa ona refutazion de la congettura de Erdős sui distanz unitari — on problema approv del 1946 —, The Decoder l'ha reportaa che l'Afferma che sò modell Claude Mythos l'ha resolt el problema original « el weekend passaa », con quel che l'ingegner Sholto Douglas el definiss « dimostrazion carina e sempliz ».
Ce résultat, s'il est confirmé, constituerait un signal fort de ce que Douglas appelle un « serious overhang » — un décalage croissant entre les capacités réelles des modèles de pointe et ce que la communauté scientifique mesure effectivement. Le fait qu'un modèle puisse produire une preuve mathématique élégante sur un problème qui a résisté aux meilleurs mathématiciens pendant près de huit décennies soulève des questions fondamentales sur la nature de la découverte assistée par IA.This result, if confirmed, would be a powerful signal of what Douglas calls a "serious overhang" — a growing gap between the real capabilities of frontier models and what the scientific community actually measures. The fact that a model could produce an elegant mathematical proof of a problem that resisted the best mathematicians for nearly eight decades raises fundamental questions about the nature of AI-assisted discovery.Dieses Ergebnis, sofern bestätigt, wäre ein starkes Signal für das, was Douglas einen « serious overhang » nennt – eine wachsende Kluft zwischen den tatsächlichen Fähigkeiten der fortschrittlichsten Modelle und dem, was die wissenschaftliche Gemeinschaft tatsächlich misst. Die Tatsache, dass ein Modell einen eleganten mathematischen Beweis für ein Problem liefern kann, das die besten Mathematiker fast acht Jahrzehnte lang nicht lösen konnten, wirft grundlegende Fragen über die Natur der KI-unterstützten Entdeckung auf.Questo risultato, se confermato, costituirebbe un segnale forte di ciò che Douglas chiama un «serious overhang» — un divario crescente tra le capacità reali dei modelli di punta e ciò che la comunità scientifica misura effettivamente. Il fatto che un modello possa produrre una dimostrazione matematica elegante su un problema che ha resistito ai migliori matematici per quasi otto decenni solleva questioni fondamentali sulla natura della scoperta assistita dall'IA.Quest resultad, se l'è confermaa, el saria on segnal forte de quel che Douglas el ciama on « serious overhang » — on sfasament cresent tra i capacità real di modell de punta e quel che la comunità scientifiga la mesura de bon. El fatt che on model el possa produr ona dimostrazion matematega eleganta su on problema che l'ha resistii ai megior matemategh per quasi ottant'ann domanda fondamental sula natura de l'assistenza a la scoverta de l'IA.
L'épisode s'inscrit dans une semaine riche en annonces de modèles. OpenRouter a référencé plusieurs nouvelles entrées majeures, dont Qwen3.7-Max d'Alibaba (1M de contexte, tarification à 1,25 $/M tokens en entrée), Grok Build 0.1 de xAI (256K de contexte, optimisé pour l'ingénierie logicielle agentique), et Gemini 3.5 Flash de Google (multimodal, 1M de contexte). Anthropic a également lancé Claude Opus 4.7 Fast, une variante à haute vitesse de son dernier modèle phare.The episode comes amid a week rich in model announcements. OpenRouter has listed several major new entries, including Alibaba's Qwen3.7-Max (1M context, priced at $1.25/M input tokens), xAI's Grok Build 0.1 (256K context, optimized for agentic software engineering), and Google's Gemini 3.5 Flash (multimodal, 1M context). Anthropic has also launched Claude Opus 4.7 Fast, a high-speed variant of its latest flagship model.Diese Episode fällt in eine Woche reicher Modellankündigungen. OpenRouter hat mehrere neue bedeutende Einträge aufgenommen, darunter Qwen3.7-Max von Alibaba (1M Kontext, Preisgestaltung ab 1,25 $/M Eingabe-Tokens), Grok Build 0.1 von xAI (256K Kontext, optimiert für Agenten-Softwareentwicklung) und Gemini 3.5 Flash von Google (multimodal, 1M Kontext). Anthropic hat zudem Claude Opus 4.7 Fast eingeführt, eine Hochgeschwindigkeitsvariante seines aktuellen Flaggschiff-Modells.L'episodio si inserisce in una settimana ricca di annunci di modelli. OpenRouter ha referenziato diverse nuove entrate importanti, tra cui Qwen3.7-Max di Alibaba (1M di contesto, tariffazione a 1,25 $/M token in ingresso), Grok Build 0.1 di xAI (256K di contesto, ottimizzato per l'ingegneria del software agentica) e Gemini 3.5 Flash di Google (multimodale, 1M di contesto). Ha inoltre lanciato Claude Opus 4.7 Fast, una variante ad alta velocità del suo ultimo modello di punta.L'episod l'è part de la settimana richa de anunci de modell. OpenRouter l'ha catalogaa diversi nov ingress maior, tra i qual Qwen3.7-Max de Alibaba (1M de contest, prezz a 1,25 $/M token in ingres), Grok Build 0.1 de xAI (256K de contest, ottimizzaa per l'ingegneria del software agentica), e Gemini 3.5 Flash de Google (multimodal, 1M de contest). L'Afferma anca lanciaa Claude Opus 4.7 Fast, ona varianta a alta velocità de sò ultim modell de ponta.