Një raport i ri nga Bloomberg zbulon se kompania Anthropic po heton një incident të mundshëm sigurie që lidhet me modelin e saj më të avancuar dhe të pa-publikuar, Claude Mythos. Ky model konsiderohet aq i fuqishëm sa vetë kompania e ka cilësuar si shumë të rrezikshëm për t’u publikuar.
Sipas deklaratës zyrtare, Anthropic ka marrë një raport që pretendon se një grup i paautorizuar ka arritur të aksesojë një version paraprak të modelit përmes një mjedisi të një pale të tretë. Bloomberg arriti të verifikojë pjesërisht këtë pretendim duke parë një demonstrim live dhe screenshots të siguruara nga një anëtar i këtij grupi anonim.
Burimi anonim pretendon se është pjesë e një grupi që ka shfrytëzuar aksesin si punonjës i një kontraktori të Anthropic. Duke përdorur mjete të zakonshme kërkimi dhe analiza në internet, të ngjashme me ato që përdorin studiuesit e sigurisë kibernetike, grupi arriti të gjejë dhe të hyjë në sistemin ku ndodhej modeli.
Ngjarja duket se ka ndodhur përmes një kombinimi faktorësh si një grup në Discord që monitoron GitHub për informacione mbi modele të pa-lançuara, një shkelje të dhënash në startup-in Mercor, dhe akses i brendshëm përmes një kontraktori. Këto elemente së bashku i lejuan grupit të identifikojë vendndodhjen online të Claude Mythos dhe ta përdorë atë që nga 7 prilli.
Megjithatë, burimi pretendon se qëllimi i grupit nuk është keqdashës, por thjesht eksperimentimi me modele të reja AI. Kjo situatë krijon një kontrast të fortë: nga njëra anë, një kompani që kërkon besimin publik për të kontrolluar një teknologji potencialisht të rrezikshme, dhe nga ana tjetër, një grup anonim që pretendon se e ka aksesuar atë pa pasoja negative.
Rasti ngre shqetësime serioze mbi sigurinë dhe kontrollin e teknologjive të avancuara të inteligjencës artificiale.

