Inteligjenca artificiale po përparon me ritme shumë të shpejta dhe sipas zhvilluesve, mund të arrijë rezultate maksimale në një nga testet më të vështira në botë, i quajtur Humanity’s Last Exam (HLE), brenda pak muajsh. Ky test përbëhet nga 2,500 pyetje shumë të ndërlikuara që mbulojnë rreth 100 fusha, nga shkenca e raketave deri te mitologjia dhe fiziologjia, dhe kërkon njohuri në nivel doktorature. Një rezultat i plotë do të nënkuptonte arritjen e nivelit të një “eksperti universal”.
Vetëm dy vite më parë, ChatGPT arriti vetëm 3% në këtë test, ndërsa sisteme të tjera si ato nga Google dhe Anthropic patën rezultate të ngjashme të ulëta. Kjo tregonte një hendek të madh mes inteligjencës artificiale dhe ekspertëve njerëzorë.
Megjithatë, progresi ka qenë i jashtëzakonshëm. Sistemi Google Gemini ka arritur rreth 45.9%, duke u rritur ndjeshëm nga përpjekjet e mëparshme. Ndërkohë, modeli Claude i Anthropic ka arritur mbi 34%. Sipas studiuesve, arritja e 100% është tashmë një objektiv i mundshëm në të ardhmen e afërt.
HLE u krijua nga kompania Scale AI dhe Center for AI Safety për të testuar jo vetëm njohuritë, por edhe aftësinë e arsyetimit të AI. Pyetjet u përzgjodhën nga dhjetëra mijëra propozime nga ekspertë në mbarë botën dhe shumë prej tyre mbahen sekrete për të shmangur manipulimin e rezultateve.
Nëse AI arrin të përfundojë me sukses këtë test, do të jetë një moment historik, i krahasueshëm me fitoren e superkompjuterit Deep Blue ndaj kampionit të shahut Garry Kasparov në vitin 1997. Megjithatë, ekspertët theksojnë se fusha si kirurgjia, kreativiteti dhe gjykimi njerëzor mbeten ende sfida për inteligjencën artificiale.

