Studiuesit e Apple prezantuan një model të ri AI që i lejon përdoruesit të përshkruajnë në gjuhë të thjeshtë atë që duan të ndryshojnë në një foto pa patur nevojë për dijeni të përgjithshme mbi software-t e ndryshëm të editimit të fotografive.
Modeli MGIE, për të cilin Apple ka punuar me Universitetin e Kalifornisë, Santa Barbara, mund të presë madhësinë e fotografisë, të ndryshojë përmasat, të rrokulliset dhe të shtojë filtra në imazhe përmes kërkesave të tekstit. MGIE, një shkurtim i MLLM-Guided Image Editing, mund të aplikohet në mjaft mirë për editimin e imazheve në nivel bazik dhe të avancuar, si modifikimi i objekteve specifike në një foto për t’i bërë ato një formë të ndryshme ose për t’i ndriçuar më tepër.
Modeli ndërthur dy përdorime të ndryshme të modeleve të gjuhës multimodale. Së pari, mëson se si të interpretojë kërkesat e përdoruesit. Pastaj “imagjinon” se si do të dukej modifikimi (për shembull, nëse kërkoni për një qiell më të kaltër në fotografinë tuaj, ajo arrihet duke rritur ndriçimin në pjesën e qiellit të një imazhi). Kur editoni një foto me MGIE, përdoruesit thjesht duhet të shkruajnë se çfarë duan të ndryshojnë në lidhje me foton.
Në studim u përdor shembulli i editimit të një imazhi të një pice me pepperoni. Pasi bëhet kërkesa që pica të jetë pak më e shëndetshme, AI shton perimet në picë. Gjithashtu një tjetër rast është dhe fotografia e errët e një tigri në Sahara, dhe pas kërkesës për të “shtuar më kontrast për të simuluar ndriçimin”, fotografia duket më e ndritshme.
Apple e bëri MGIE të disponueshëm përmes GitHub për shkarkim, por gjithashtu lëshoi një demonstrim në internet në Hugging Face Spaces, raporton VentureBeat. Kompania nuk tha se cilat janë planet e saj për modelin përtej kërkimit.