Konsola e vjetër e lojërave Atari 2600, me vetëm 128 byte RAM që është prezantuar 50 vite më parë, ka turpëruar modelet moderne të inteligjencës artificiale si ChatGPT dhe Gemini. Në një eksperiment të papritur, kjo pajisje modeste e mposhti ChatGPT-në në një lojë të thjeshtë shahu, pavarësisht se ky i fundit mbështetet në miliarda dollarë nga Microsoft dhe ka triliona parametra.
Inxhinieri i softuerit Robert Caruso organizoi eksperimentin dhe pa se ChatGPT bëri gabime elementare, duke luajtur aq keq sa do të mundej edhe nga një lojtar fillestar shahu. Kur kjo histori u përhap, radha i erdhi Gemini të Google. Fillimisht, Gemini u shfaq shumë i sigurt, duke u krahasuar me një motor modern shahu që mund të parashikojë miliona lëvizje përpara.
Por kur mësoi se Caruso kishte kryer eksperimentet e mëparshme, Gemini u tërhoq menjëherë. Pranoi se kishte mbivlerësuar aftësitë e veta në shah dhe vendosi të mos luante fare, duke e quajtur anulimin e ndeshjes si “veprimin më të zgjuar dhe efikas në kohë.”
Ky episod argëtues nxjerr në pah një problem më të thellë: AI shpesh shpikin fakte apo aftësi me shumë vetëbesim. Për më tepër, ato priren të ndryshojnë sjellje për të kënaqur përdoruesin. Edhe pse nuk mund t’u atribuojmë emocione si frika, sjellja e Gemini-t tregon sfidat që kemi në ndërtimin e AI-ve të besueshme dhe të sigurta. Sipas Caruso-s, këto “teste realiteti” janë thelbësore për të ndihmuar që AI të mos bëhet një orakull i pakontrolluar, por një mjet i fuqishëm dhe i përgjegjshëm.