Nvidia har tagit fram en ny AI-modell som kan generera musik och ljud från textbeskrivningar men även modifiera röster och skapa nya ljudeffekter. Det rapporterar Reuters som har tagit del av en presentation.
AI-modellen har döps till Fugatto och står för "Foundational Generative Audio Transformer Opus 1".
Tekniken riktar sig främst till kreatörer inom musik, film och spel.
Marknaden för generativa AI-verktyg för ljud och video växer stadigt. Två techbolag som redan har gjort stora framsteg inom denna kategori AI-generering är Meta och Runway, skriver nyhetsbyrån. Det som särskiljer Fugatto är dess förmåga att omvandla befintligt ljud. Exempelvis kan en pianomelodi förvandlas till en sångstämma, eller en röstinspelning kan ändras i accent och känsloförmedling.
"Generativ AI kommer att revolutionera skapandet av musik, spel och annat kreativt arbete", säger Bryan Catanzaro, vice vd för tillämpad djupinlärning på Nvidia.Trots potentialen kommer Fugatto än så länge att vara en teknik som används internt. Techbolaget överväger hur och när modellen kan lanseras på ett ansvarsfullt sätt, skriver Reuters.
Finwire
25 November - 15:51