Google po formon një ekip të ri që do të punojë për të krijuar modele AI që mund të simulojnë botën fizike.
Tim Brooks – një nga bashkë-drejtuesit në gjeneratorin e videove të OpenAI, Sora, i cili u largua për t’iu bashkuar laboratorit të kërkimit të AI të Google në tetor, Google DeepMind – do të drejtojë ekipin e ri, gjë që e bëri të ditur përmes një postimi në X.
“DeepMind ka plane ambicioze për të bërë modele masive gjeneruese që simulojnë botën”, shkroi Brooks të hënën në mëngjes. “Unë jam duke kërkuar për punonjës të rinj me këtë mision.” Sipas listimeve të punës të bëra nga Brooks në postimin e tij, ekipi i ri i modelimit do të bashkëpunojë dhe do të ndërtohet mbi punën nga ekipet e Google Gemini, Veo dhe Genie për të trajtuar “problemet e reja kritike” dhe për të shkallëzuar modelet “në nivelet më të larta të llogaritjes“.
Gemini është seria kryesore e modeleve të AI të Google për detyra të tilla si analizimi i imazheve dhe gjenerimi i tekstit, ndërsa Veo është modeli i gjenerimit të videove të Google. Sa i përket Genie, është përpjekja e Google për një model AI që mund të simulojë lojëra dhe mjedise 3D në kohë reale. Modeli më i fundit Genie i Google mund të gjenerojë një larmi të madhe botësh 3D të luajtshme.
“Ne besojmë se shkallëzimi [trajnimi i AI] në video dhe të dhëna multimodale është tepër e rëndësishme në rrugën drejt inteligjencës së përgjithshme artificiale,” thuhet në një nga përshkrimet e punës.
Inteligjenca e përgjithshme artificiale, ose AGI, në përgjithësi i referohet AI që mund të përmbushë çdo detyrë që mundet një njeri. “Modelet botërore do të fuqizojnë fusha të shumta, të tilla si arsyetimi dhe simulimi vizual, planifikimi për agjentët e mishëruar dhe argëtimi interaktiv në kohë reale.”
Sipas përshkrimit, ekipi i ri i Brooks do të kërkojë të zhvillojë mjete “gjenerimi interaktiv në kohë reale” mbi modelet që ata ndërtojnë dhe të studiojë se si të integrojnë modelet e tyre me modelet ekzistuese multimodale si Gemini. Një numër i startup-eve dhe kompanive të mëdha të teknologjisë po ndjekin këtë strategji, duke përfshirë studiuesin me ndikim të AI Fei-Fei Lee’s World Labs, Decart dhe Odyssey.
Ata besojnë se modele të tilla një ditë mund të përdoren për të krijuar media ndërvepruese, si video lojërat dhe filmat, dhe për të ekzekutuar simulime realiste si mjedise trajnimi për robotët.