Stability AI har släppt Stable Audio 3.0, en ny familj av ljudmodeller som tar AI-genererad musik ett tydligt steg vidare. Där tidigare verktyg ofta har handlat om kortare klipp, loopar eller enklare ljudidéer kan de större modellerna i Stable Audio 3.0 skapa musikstycken på över sex minuter.

Det gör lanseringen intressant på riktigt. Inte för att AI plötsligt ersätter musikskapande, utan för att tekniken nu börjar närma sig det format vi faktiskt lyssnar på till vardags. En låt är inte bara ett ljudklipp. Den behöver struktur, dynamik, variation och någon form av känsla av början, mitt och slut.

Enligt Stability AI är Stable Audio 3.0 tränad på licensierat material. Det är en viktig detalj, eftersom AI-musik just nu är ett av de mest känsliga områdena inom generativ AI. Frågor om upphovsrätt, träningsdata och ersättning till kreatörer hänger över hela branschen. Att Stability AI trycker så hårt på licensierad data är därför inte bara en teknisk detalj, utan också en tydlig positionering.

Modellfamiljen består av flera versioner. Stable Audio 3.0 Small SFX är gjord för ljudeffekter, medan Stable Audio 3.0 Small ska kunna skapa musik direkt på enheten. Stable Audio 3.0 Medium kan skapa längre musikstycken på upp till 6 minuter och 20 sekunder, och Stable Audio 3.0 Large är den mest avancerade modellen, riktad mot plattformar och professionella användare via API eller företagslösningar.

Tre av modellerna släpps som öppna vikter, vilket betyder att utvecklare och kreatörer kan ladda ner och bygga vidare på dem. Det kan göra Stable Audio 3.0 extra intressant för mindre studios, kreativa verktyg, spelutvecklare, YouTubers och andra som vill experimentera med ljud utan att vara helt låsta till en stängd tjänst.

Det här väcker samtidigt en större fråga om hur vi som lyssnare vill möta AI-musik. Personligen skulle jag gärna vilja kunna välja i Spotify eller Apple Music om jag vill visa eller filtrera bort musik som är skapad med AI. Inte för att AI-musik automatiskt är dålig, utan för att transparens borde vara en självklar del av lyssnarupplevelsen. Ibland kanske man vill utforska vad tekniken kan göra. Ibland vill man veta att det faktiskt är människor bakom musiken.

För musikbranschen kan den här typen av teknik bli både ett verktyg och en utmaning. Den kan hjälpa kreatörer att snabbt ta fram skisser, bakgrundsmusik, ljudeffekter eller alternativa versioner av ett spår. Men den kan också leda till en våg av billigt AI-innehåll som gör det svårare för mänskliga artister att synas.

Det mest intressanta med Stable Audio 3.0 är därför inte bara att modellen kan skapa längre låtar. Det är att AI-musik börjar bli tillräckligt användbar för att behöva tas på allvar. Nästa steg handlar inte bara om bättre ljudkvalitet, utan om tydligare märkning, bättre rättighetsmodeller och plattformar som ger lyssnaren mer kontroll.

AI-musiken är inte längre bara ett experiment. Den börjar bli en del av musiklandskapet.

Källor: Stability AI, TechCrunch, Music Business Worldwide, The Decoder

Kommentera