GPT-4 arrin të gjejë dobësitë në sisteme të ndryshme me saktësi 53%

Last updated: 12 Qershor, 2024 9:42 am

3 Min lexim

Studiuesit ishin në gjendje të hakonin me sukses më shumë se gjysmën e faqeve të tyre të testimit duke përdorur ekipe autonome të robotëve GPT-4, duke koordinuar përpjekjet e tyre dhe duke krijuar robotë të rinj sipas dëshirës. GPT-5 ishte në gjendje të shfrytëzonte dobësi në sistem duke bërë sulme zero day të panjohura më parë.

Disa muaj më parë, një ekip studiuesish publikoi një letër ku shpjegonin se ata kishin qenë në gjendje të përdornin GPT-4 për të shfrytëzuar në mënyrë autonome dobësitë njëditore (ose N-day) – këto janë të meta sigurie që tashmë dihen, por për të cilat një rregullim ende nuk është publikuar.

Nëse vepronte në bazë të listës Common Vulnerabilities and Exposures (CVE), GPT-4 ishte në gjendje të shfrytëzonte 87% të CVE-ve me ashpërsi kritike më vete. I njëjti grup studiuesish publikoi një dokument vijues duke thënë se ata kanë qenë në gjendje të hakojnë dobësitë zero day – dobësi që nuk dihen ende – me një LLM autonome dhe vetë-përhapëse duke përdorur metodën e Planifikimit Hierarkik me Agjentë Specifikë për Detyrat (HPTSA).

Në vend që të caktojë një agjent të vetëm LLM duke u përpjekur të zgjidhë shumë detyra komplekse, HPTSA përdor një “agjent planifikimi” që mbikëqyr të gjithë procesin dhe lëshon “nën-agjentë” të shumtë që janë specifike për detyrat.

Ashtu si një shef dhe vartësit e tij, agjenti i planifikimit koordinon agjentin menaxhues i cili delegon të gjitha përpjekjet e secilit “nënagjent ekspert“, duke reduktuar ngarkesën e një agjenti të vetëm në një detyrë me të cilën mund të ketë vështirësi. Është një teknikë e ngjashme me atë që përdor Cognition Labs me ekipin e saj të zhvillimit të softuerit Devin AI; ai planifikon një punë, kupton se çfarë lloj punëtorësh do t’i nevojiten, më pas menaxhon punën deri në përfundim, ndërsa krijon ‘punonjës’ e vet specialistë për të trajtuar detyrat sipas nevojës.

Kur krahasohet me 15 dobësi të fokusuara në ueb në botën reale, HPTSA ka treguar të jetë 550% më efikas se një LLM e vetme në shfrytëzimin e dobësive dhe ishte në gjendje të hakonte 8 nga 15 dobësitë zero day. Përpjekja solo LLM ishte në gjendje të hakonte vetëm 3 nga 15 dobësitë.