Nvidia thotë se gjeneruesi i ri i muzikës AI mund të krijojë “tinguj të padëgjuar më parë” – si një instrument muzikor që mjaullin.
Shërbimi i quajtur Fugatto, është i aftë të gjenerojë muzikë, tinguj dhe të folur duke përdorur inpute teksti dhe audio për të cilat nuk është trajnuar kurrë. Siç tregohet në këtë video më poshtë, kjo i lejon Fugatto-s të krijojë tinguj të rinj në bazë të prompts të çuditshëm, si “Krijoni një saksofon që ulërit, leh, pastaj muzikë elektronike me qen që lehin“.
Disa shembuj të tjerë të ndarë nga kompania përfshijnë aftësinë për të prodhuar efekte unike zanore bazuar në një përshkrim, si “Pulse të thella, gjëmuese të basit të çiftëzuara me cicërima dixhitale të ndërprera, me zë të lartë, si tingulli i një makinerie gjigande që zgjohet“.
Madje mund të transformojë tingullin e zërit të dikujt, duke ndryshuar theksin ose duke i dhënë një ton tjetër, si të zemëruar apo të qetë. Ka edhe mënyra për të edituar muzikën, pasi Fugatto mund të izolojë vokalin në një këngë, të shtojë instrumente dhe madje të ndryshojë një melodi duke ndërruar një piano me një këngëtar opere.
Tashmë ka disa mjete të tjera AI që kryejnë këto funksione, duke përfshirë ato nga Stability AI, OpenAI, Google DeepMind, ElevenLabs dhe Adobe, por asnjëri nga këto shërbime nuk arrin të krijojë tinguj krejtësisht të rinj dhe të padëgjuar.
Për të ndërtuar Fugatto, Nvidia thotë se studiuesit duhej të krijonin një grup të dhënash me miliona mostra audio. Më pas ata krijuan udhëzime “që zgjeruan ndjeshëm gamën e detyrave që modeli mund të kryente, duke arritur performancë më të saktë dhe duke mundësuar detyra të reja pa kërkuar të dhëna shtesë“. Nvidia nuk thotë se kur – ose nëse – mjeti do të jetë gjerësisht i disponueshëm.