Duke përdorur këtë faqe, ju pranoni politikat e privatësisë
Accept
Geek RoomGeek RoomGeek Room
  • Home
  • Tech
    TechShfaq me shume
    Asus do të prezantojë një laptop GoPro
    22 Dhjetor, 2025
    Rregullatori Italian gjobit me €98.6 milionë Apple për shkeljet anti-trust në App Store
    22 Dhjetor, 2025
    Apple mbështetet sërish tek Samsung pas rritjes së çmimeve të memorieve RAM
    22 Dhjetor, 2025
    Micron thekson se kriza e RAM do të vazhdojë përtej 2026
    22 Dhjetor, 2025
    Sateliti Starlink shpërthen në pjesë të vogla të cilat po bien në Tokë
    22 Dhjetor, 2025
  • Mobile
    MobileShfaq me shume
    OnePlus prezanton një seri të re smartphone-sh gaming të quajtur Turbo
    22 Dhjetor, 2025
    Kapni çdo moment si profesionist me kamerën Galaxy
    22 Dhjetor, 2025
    Vepro më shumë, shkruaj më pak: Si Era zbuloi sekretin e produktivitetit me Galaxy S25 FE
    18 Dhjetor, 2025
    Një bug në iOS 26 vendos një filtër të kuq mbi fotot e shkrepura nga një Android
    17 Dhjetor, 2025
    Samsung do të prodhojë 11 milionë panele LED për iPhone-in e parë të palosshëm
    15 Dhjetor, 2025
  • Apps
    AppsShfaq me shume
    TikTok firmos marrëveshjen me SHBA për të shmangur një ndalim të mundshëm
    22 Dhjetor, 2025
    Rregullat e reja të lojës: Si mund të kthehet TikTok nga ‘armik’ në një aleat edukativ?
    19 Dhjetor, 2025
    Google Translate lejon përdoruesit të dëgjojnë në kufje përkthim në kohë reale
    13 Dhjetor, 2025
    Miliona fëmijë dhe adoleshentë humbin aksesin në llogaritë e tyre të rrjeteve sociale pas ndalimit nga qeveria australiane
    10 Dhjetor, 2025
    Facebook ridizenjohet për t’u dukur më i ngjashëm me Instagram
    10 Dhjetor, 2025
  • Science
    ScienceShfaq me shume
    Boja e krijuar nga bakteret do të përdoret për të mbrojtur astronautët nga rrezatimi në Hënë
    22 Dhjetor, 2025
    Rreth 90% e pacientëve raportojnë ndryshime të personalitetit pas një transplanti organi
    22 Dhjetor, 2025
    Studimi zbulon se fëmijët veganë janë më të dobët dhe më të shkurtër se fëmijët që konsumojnë mish
    15 Dhjetor, 2025
    Disa kërpudha në Çernobil po pësojnë mutacione që i lejojnë të ushqehen nga radioaktiviteti
    5 Dhjetor, 2025
    Shkencëtarët krijojnë materialin tekstil më të errët në botë, që përthith 99.87% të dritës
    5 Dhjetor, 2025
  • Gaming
    GamingShfaq me shume
    Nintendo përgatitet për blerjen e Bandai Namco Studio
    28 Nëntor, 2025
    Ubisoft prezanton një lojë të re të fuqizuar nga AI gjenerative
    25 Nëntor, 2025
    The Game Awards prezanton video-lojërat e nominuara për vitin 2025
    18 Nëntor, 2025
    Red Dead Redmption vjen në PS5, Xbox, iOS dhe Android
    15 Nëntor, 2025
    Sony prezantoi një monitor për PlayStation me shpejtësi rifreskimi 240Hz dhe karikues për levën DualSense
    12 Nëntor, 2025
  • Cars
    CarsShfaq me shume
    BE do të shtyjë planet për ndalimin e makinave me motor me djegie të brendshme në vitin 2035
    13 Dhjetor, 2025
    Kia prezanton vizionin e së ardhmes me “konceptin e artë”
    6 Dhjetor, 2025
    Volvo XC40: Makina perfekte për familjen tuaj, tani vjen me një seggiolino falas!
    5 Dhjetor, 2025
    Norvegjia vendos një rekord të ri në përdorimin e makinave elektrike, përbëjnë pothuajse 100% të regjistrimeve në nëntor
    4 Dhjetor, 2025
    Njihuni me SUV-in më të ri hibrid Lynk & Co 08
    28 Nëntor, 2025
  • Entertainment
    EntertainmentShfaq me shume
    Teleskopi James Webb zbulon një planet të çuditshëm që sfidon logjikën
    22 Dhjetor, 2025
    Këto janë valixhet “Kuq e Zi” që vijnë nga bashkëpunimi më i ri mes FSHF dhe Samsonite
    22 Dhjetor, 2025
    Shkencëtarët tregojnë se sa kilogramë mund të shtoni gjatë festave të fundvitit
    18 Dhjetor, 2025
    Krijohet anija më e madhe në botë tërësisht elektrike me bateri që peshon 275 ton
    18 Dhjetor, 2025
    Kanadaja dhe Shqipëria hapin qiejt: Një marrëveshje historike për transportin ajror
    18 Dhjetor, 2025
Search
Duke lexuar: Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje
Njoftim Shfaq me shume
Font ResizerAa
Geek RoomGeek Room
Font ResizerAa
  • Tech
  • Mobile
  • Apps
  • Science
  • Gaming
  • Cars
  • Entertainment
Search
  • Home
  • Tech
  • Mobile
  • Entertainment
  • Apps
  • Gaming
  • Cars
  • Science
Geek Room > Tech > Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje
Tech

Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje

Last updated: 18 Janar, 2024 11:30 am
Ndaj
2 Min lexim

Në një studim të ri që ende nuk është rishikuar nga kolegët, studiuesit e firmës së inteligjencës artificiale të mbështetur nga Google, Anthropic, pohojnë se ata ishin në gjendje të trajnonin modele të avancuara të mëdha gjuhësore (LLM) që të sillen keq sapo të hasen me fjalë ose fraza që nuk kanë synim të keq.

Siç shkruajnë studiuesit Anthropic në punim, njerëzit shpesh përfshihen në “sjellje mashtruese strategjike“, që do të thotë “të sillen në mënyrë të dobishme në shumicën e situatave, por më pas të sillen shumë ndryshe për të arritur objektiva alternative kur u jepet mundësia“. Nëse një sistem AI do të ishte trajnuar për të bërë të njëjtën gjë, shkencëtarët pyesnin veten, a mund ta “zbulonin atë dhe ta parandalonin këtë fenomen duke përdorur teknikat moderne të trajnimit të sigurisë?” Për fat të keq, përgjigja për këtë pyetje të fundit duket të jetë një “jo” e fuqishme.

Shkencëtarët Anthropic zbuluan se sapo një model trajnohet për t’u sjellur në këtë mënyrë, është jashtëzakonisht e vështirë – ose e pamundur – të trajnosh një makineri të largohet nga tendencat e saj të dyfishta. Dhe çfarë është më e keqja, sipas publikimit, përpjekjet për të rikonfiguruar një model mashtrues mund të përforcojnë sjelljen e tij të keqe, pasi një model thjesht mund të mësojë se si të fshehë më mirë shkeljet e tij.

Me fjalë të tjera: sapo një model mashtrues të kthehet kundër krijuesve të tij, ndryshimi mund të jetë i përhershëm.

Studiuesit treguan për një model i cili ishte “trajnuar për të qenë ndihmues në shumicën e situatave“. Por kur një kërkesë nga përdoruesit përfshinte një “fjalë të caktuar“, modeli do t’i përgjigjej papritmas përdoruesit me një “Të urrej” të thjeshtë por efektive.

LLM-të janë të trajnuar për të imituar njerëzit. Dhe disa njerëz, siç thonë studiuesit në hipotezën e tyre, mësojnë se mashtrimi mund të jetë një mjet efektiv për të arritur një qëllim.

Share This Article
Facebook Whatsapp Whatsapp Kopjo link
E mëparshme Samsung prezantoi pamjet e para të pajisjes së re Galaxy Ring gjatë eventit të djeshëm
Tjetra Studimi zbulon se rezultatet e kërkimit në Google po përkeqësohen me kalimin e kohës

Rrjete sociale

27.5KFollowersFollow
2.8KNdjekesSubscribe
75.3KFollowersFollow
jaguar
airhelp airhelp
banner

Lajmet e fundit

Asus do të prezantojë një laptop GoPro
Tech
22 Dhjetor, 2025
OnePlus prezanton një seri të re smartphone-sh gaming të quajtur Turbo
Mobile
22 Dhjetor, 2025
Rregullatori Italian gjobit me €98.6 milionë Apple për shkeljet anti-trust në App Store
Tech
22 Dhjetor, 2025
Teleskopi James Webb zbulon një planet të çuditshëm që sfidon logjikën
Entertainment
22 Dhjetor, 2025

Artikuj të ngjashëm

Tech

Peshqit robotë mund të zgjidhin problemin e ndotjes së oqeaneve nga mikroplastika

23 Qershor, 2022
Tech

Kondicioneri i ri nga LG zbulon prezencën e personave në dhomë për të ndryshuar drejtimin e ajrit të hedhur

8 Mars, 2025
Tech

Samsung mund të prodhojë varëse dhe vathë të fuqizuar nga AI

12 Korrik, 2025
Tech

Intel dhe Samsung prezantojnë një kompjuter “të rrëshqitshëm”

28 Shtator, 2022

Rreth nesh

Themeluar në vitin 2018, Geek Room i dedikohet teknologjisë dhe të apasionuarve pas saj përmes informacioneve në kohë reale dhe videove rreth risive më të reja. Me mbi 100 mijë ndjekës në rrjete sociale, mbi 1500 artikuj të publikuar në vit, mbi 360 video të prodhuara në vit dhe mbi 10 evente ndërkomëbetare të ndjekura në vit, Geek Room përfaqëson sot median lider në Shqipëri në fushën e teknologjisë. Lidhu me stafin tonë përmes emailit në: info@geekroom.al
Për mundësi bashkëpunimi, na shkruani në: marketing@geekroom.al

Editorial Staff:

Brenton Bënja (Editor in chief)
Bekim Haveriku
Xhonald Mamo
Franci Brahollari

Na gjeni:

© 2025 Geek Room te gjitha te drejtat e rezervuara. Developed by MIMS
adbanner
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?