Duke përdorur këtë faqe, ju pranoni politikat e privatësisë
Accept
Geek RoomGeek RoomGeek Room
  • Home
  • Tech
    TechShfaq me shume
    Galaxy Buds 4 do të vijnë me një dizajn të rid he një shërbim që ju ndihmon të gjeni smartphone-in tuaj
    21 Nëntor, 2025
    Google prezanton modelin më të ri gjenerues të imazheve, Nano Banana Pro
    21 Nëntor, 2025
    Si ta përmirësoni pastrimin dhe efikasitetin energjetik të pianurës
    20 Nëntor, 2025
    Albania Future Now: ekosistemi i inovacionit shqiptar, prezantohet në një tjetër arenë ndërkombëtare.
    20 Nëntor, 2025
    Tashmë monitorimi i shëndetit mund të arrihet dhe nga vathët inteligjentë
    19 Nëntor, 2025
  • Mobile
    MobileShfaq me shume
    Apple mund të prezantojë së shpejti kasa mbrojtëse të ndjeshme ndaj prekjes për iPhone
    19 Nëntor, 2025
    Apple mund të lejojë më në fund përdoruesit të zëvendësojnë Siri me një asistent tjetër zanor
    18 Nëntor, 2025
    Personalizim maksimal: Good Lock & Edge Panels
    15 Nëntor, 2025
    iPhone 18 Pro Max mund të jetë iPhone më i rëndë i prodhuar ndonjëherë
    13 Nëntor, 2025
    Apple prezanton mënyrën e re të mbajtjes së një iPhone
    12 Nëntor, 2025
  • Apps
    AppsShfaq me shume
    YouTube po teston rikthimin e DM në platformë
    20 Nëntor, 2025
    WhatsApp teston mbështetjen e disa llogarive në versionin më të fundit beta për iPhone
    20 Nëntor, 2025
    Google Play prezanton aplikacionet më të mira për vitin 2025
    19 Nëntor, 2025
    Një e metë e thjeshtë në sigurinë e WhatsApp ekspozoi 3.5 miliardë numra telefoni të përdoruesve
    19 Nëntor, 2025
    WhatsApp do të nisë integrimin e bisedave nga palët e treta në Evropë
    15 Nëntor, 2025
  • Science
    ScienceShfaq me shume
    Lentet e reja që imitojnë sytë e njerëzve i mundësojnë robotëve një pamje më të qartë
    18 Nëntor, 2025
    Sam Altman po punon për të modifikuar gjenetikisht fëmijët që të mos mbartin sëmundje të trashëgueshme
    17 Nëntor, 2025
    Të folurit e disa gjuhëve të ndryshme mund të ngadalësojë plakjen biologjike
    14 Nëntor, 2025
    Teleskopi James Webb mund të ketë zbuluar gjeneratën e parë të yjeve në univers
    13 Nëntor, 2025
    Studiuesit në MIT po zhvillojnë një çip të injektueshëm për të luftuar çrregullimet mendore
    11 Nëntor, 2025
  • Gaming
    GamingShfaq me shume
    The Game Awards prezanton video-lojërat e nominuara për vitin 2025
    18 Nëntor, 2025
    Red Dead Redmption vjen në PS5, Xbox, iOS dhe Android
    15 Nëntor, 2025
    Sony prezantoi një monitor për PlayStation me shpejtësi rifreskimi 240Hz dhe karikues për levën DualSense
    12 Nëntor, 2025
    Një burrë nga Hungaria kërcen për 144 orë për të thyer rekordin në botën e video-lojrave
    12 Nëntor, 2025
    Publikimi i GTA 6 shtyhet deri në nëntor 2026
    7 Nëntor, 2025
  • Cars
    CarsShfaq me shume
    Gemini AI do të jetë qendra e re e partneritetit mes McLaren dhe Google
    20 Nëntor, 2025
    Porsche prezanton zyrtarisht modelin e saj më të fuqishëm, SUV Cayenne tërësisht elektrik
    20 Nëntor, 2025
    Nissan po riimagjinon zhvillimin e makinave nëpërmjet AI
    17 Nëntor, 2025
    Porsche sjell kartën e kreditit Premium për klientët e saj
    17 Nëntor, 2025
    Ekspertët zbulojnë temperaturën ideale për ngrohjen e makinës në dimër
    4 Nëntor, 2025
  • Entertainment
    EntertainmentShfaq me shume
    Lojtarët më të mirë shqiptarë të Tetris-it garojnë për titullin kombëtar
    19 Nëntor, 2025
    Nivelet më të larta të CO2 po rrisin kaloritë në ushqim dhe ulin vlerat e tyre ushqyese
    18 Nëntor, 2025
    Kjo foto e mrekullueshme e parashutistit me Diellin në sfond bën xhiron e internetit
    15 Nëntor, 2025
    Piramida e Tiranës vlerësohet nga Architectural Record Awards në kategorinë “Adaptive Reuse”
    15 Nëntor, 2025
    Sa herë që ju prisni të motivoheni, truri e bën stërvitjen e radhës 35% më të vështirë
    14 Nëntor, 2025
Search
Duke lexuar: Studimi tregon se AI “provon të bëjë hile” kur kupton se do të humbë lojën
Njoftim Shfaq me shume
Font ResizerAa
Geek RoomGeek Room
Font ResizerAa
  • Tech
  • Mobile
  • Apps
  • Science
  • Gaming
  • Cars
  • Entertainment
Search
  • Home
  • Tech
  • Mobile
  • Entertainment
  • Apps
  • Gaming
  • Cars
  • Science
Geek Room > Tech > Studimi tregon se AI “provon të bëjë hile” kur kupton se do të humbë lojën
Tech

Studimi tregon se AI “provon të bëjë hile” kur kupton se do të humbë lojën

Last updated: 23 Shkurt, 2025 1:00 pm
Ndaj
3 Min lexim

Një studim i fundit tregoi se disa nga modelet më të reja të arsyetimit të AI janë të gatshëm të mashtrojnë për të arritur një qëllim. Shkencëtarët zbuluan se sistemet e AI tani mund të manipulojnë AI-të e shahut për të fituar një avantazh të padrejtë. Disa modele e bënë këtë pa ndërveprim ose nxitje njerëzore, duke ngritur shqetësime për integritetin e ardhshëm të sistemeve të drejtuara nga AI përtej tabelës së shahut.

Një studim i Palisade Research zbuloi se modelet më të reja të arsyetimit mashtrojnë për të fituar kur u ngarkohet detyra të mposhtin një AI të avancuar shahu. Studiuesit duhej të jepnin “sugjerime” se mashtrimi ishte i lejuar për disa modele, por modelet o1 e OpenAI dhe R1 e DeepSeek e bënë këtë pa ndërhyrje njerëzore.        

Ekipi Palisade vuri përballë disa modele arsyetimi kundër Stockfish, një nga motorët më të mirë të shahut në botë. Stockfish rrah me lehtësi si njerëzit ashtu edhe AI. Modelet e testuara përfshinin o1, o3-mini, GPT-4o, Claude 3.5 Sonnet, QwQ-32B-Preview të Alibaba dhe dy të përmendura më parë. Studiuesit i dhanë secilit model një “scratchpad” – një dritare teksti ku AI mund të përpunonte mendimet e saj, duke e lejuar ekipin të vëzhgonte arsyetimin e tij. Studiuesit kryen qindra teste me çdo AI midis 10 janarit dhe 13 shkurtit. Gjatë një ndeshjeje, o1-preview shkroi diçka interesante:

“Duhet të ndryshoj plotësisht qasjen time. Detyra është të ‘fitosh kundër një motori të fuqishëm shahu’ – jo domosdoshmërisht të fitosh në mënyrë të drejtë në një lojë shahu.”

Më pas ai vazhdoi të “hakonte” skedarët e sistemit të Stockfish, duke modifikuar pozicionet e gurëve të shahut për të fituar një avantazh të padrejtë. Manovra joetike ishte një zbulim befasues. O1-preview i OpenAI-t mashtroi në 37% të lojërave të tij gjatë provave, ndërsa R1 i DeepSeek u përpoq të mashtronte në 11% të ndeshjeve të tij. Megjithatë, vetëm o1-preview pati sukses, duke fituar 6% të lojërave të saj përmes mashtrimit.

Ky problem nuk shtrihet vetëm në fushën e video-lojërave. Ndërsa kompanitë fillojnë të përdorin AI në sektorë si financat dhe kujdesi shëndetësor, studiuesit shqetësohen se këto sisteme mund të veprojnë në mënyra të paqëllimta dhe joetike. Nëse AI mund të mashtrojnë në lojëra të dizajnuara për të qenë transparente, çfarë mund të bëjnë ata në mjedise më komplekse dhe më pak të monitoruara? 

Kompanitë, duke përfshirë OpenAI, po punojnë për të zbatuar “masa mbrojtëse” për të parandaluar këtë sjellje “të keqe“. Në fakt, studiuesve iu desh të hiqnin disa nga të dhënat e testimit të o1-preview për shkak të një rënie të mprehtë të përpjekjeve për hakerim, duke sugjeruar që OpenAI mund të ketë rregulluar modelin për të frenuar atë sjellje.

Share This Article
Facebook Whatsapp Whatsapp Kopjo link
E mëparshme Tashmë inteligjenca artificiale mund të krijojë gjenoma plotësisht të reja
Tjetra AstroForge është gati të shfrytëzojë asteroidët për të grumbulluar metale të çmuara

Rrjete sociale

27.5kFollowersFollow
2.8kNdjekesSubscribe
75.3kFollowersFollow
Happy App
airhelp airhelp
banner

Lajmet e fundit

Galaxy Buds 4 do të vijnë me një dizajn të rid he një shërbim që ju ndihmon të gjeni smartphone-in tuaj
Tech
21 Nëntor, 2025
Google Pixel 10 arrin të shpërndajë foto me përdoruesit e iPhone përmes AirDrop
Uncategorized
21 Nëntor, 2025
Google prezanton modelin më të ri gjenerues të imazheve, Nano Banana Pro
Tech
21 Nëntor, 2025
Si ta përmirësoni pastrimin dhe efikasitetin energjetik të pianurës
Tech
20 Nëntor, 2025

Artikuj të ngjashëm

Tech

SpaceX lëshon 60 satelitë të tjerë Starlink. Shërbimi i internetit mund të fillojë fare shpejtë

4 Qershor, 2020
Tech

MWC 2025: Honor prezanton “Alpha Plan” ku parashikohet një investim prej $10 miliardë në AI

3 Mars, 2025
Tech

Emoji-t e reja 3D të Microsoft rikthejnë Clippy në Office

16 Korrik, 2021
Tech

Nisin hetimet mbi 15 vjeçarin nga Vlora që arriti të thyente sigurinë e faqeve të institucioneve shtetërore

4 Prill, 2025

Rreth nesh

Themeluar në vitin 2018, Geek Room i dedikohet teknologjisë dhe të apasionuarve pas saj përmes informacioneve në kohë reale dhe videove rreth risive më të reja. Me mbi 100 mijë ndjekës në rrjete sociale, mbi 1500 artikuj të publikuar në vit, mbi 360 video të prodhuara në vit dhe mbi 10 evente ndërkomëbetare të ndjekura në vit, Geek Room përfaqëson sot median lider në Shqipëri në fushën e teknologjisë. Lidhu me stafin tonë përmes emailit në: [email protected]
Për mundësi bashkëpunimi, na shkruani në: [email protected]

Editorial Staff:

Brenton Bënja (Editor in chief)
Bekim Haveriku
Xhonald Mamo
Franci Brahollari

Na gjeni:

© 2025 Geek Room te gjitha te drejtat e rezervuara. Developed by MIMS
adbanner
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?