Anthropic har lanserat Claude Opus 4.8, och den mest intressanta nyheten handlar inte bara om att modellen blivit bättre på kod, dokumentanalys eller avancerade arbetsflöden. Bolaget lyfter också fram något mer ovanligt: att Claude ska bli bättre på att erkänna osäkerhet.

Det låter kanske som en liten detalj, men det är en av de stora frågorna med dagens AI-verktyg. Många modeller kan skriva snabbt, sammanfatta långa texter, föreslå kod och hjälpa till med research. Problemet är att de ibland gör det med alldeles för stor självsäkerhet, även när svaret är fel. En AI som säger “jag är inte säker” kan därför vara mer användbar än en AI som alltid låter övertygad.

Enligt Anthropic är Claude Opus 4.8 bättre på att upptäcka problem i sitt eget arbete och mindre benägen att göra påståenden som den inte har stöd för. Bolaget skriver att tidiga testare upplever att modellen oftare flaggar osäkerhet och mer sällan drar för snabba slutsatser. The Verge rapporterar också att modellen enligt Anthropic är ungefär fyra gånger mindre benägen än föregångaren att missa eller ignorera fel i sin egen kod.

Claude Opus 4.8 får även nya funktioner för mer avancerat arbete. En av dem heter Dynamic Workflows och finns i research preview. Funktionen låter Claude dela upp större uppgifter i flera parallella arbetsflöden med hjälp av subagenter. Tanken är att modellen ska kunna hantera mer omfattande projekt, till exempel större kodbaser, migreringar och längre analysuppgifter.

Anthropic lyfter också att modellen ska vara starkare inom bland annat datoranvändning, juridiska arbetsflöden och agentiska uppgifter. Samtidigt är det tydligt att bolaget försöker positionera Claude på ett lite annat sätt än konkurrenterna. Medan AI-racet ofta handlar om hastighet, pris och benchmarkresultat försöker Anthropic göra tillförlitlighet och omdöme till en viktig del av produkten.

Källor: Anthropic, The Verge, Reuters, TechCrunch

Bild: AI-genererad

Kommentera