Duke përdorur këtë faqe, ju pranoni politikat e privatësisë
Accept
Geek RoomGeek RoomGeek Room
  • Home
  • Tech
    TechShfaq me shume
    Microsoft dëshiron të zëvendësoje çdo rresht kodi të shkruar në C dhe C++ deri në 2030
    25 Dhjetor, 2025
    Së shpejti ju do të keni mundësinë të ndryshoni adresën tuaj të Gmail
    25 Dhjetor, 2025
    Italia kërkon që Meta të heqë kufizimet për chatbotët rivalë në WhatsApp
    25 Dhjetor, 2025
    Samsung prezanton linjën e re të monitorëve gaming Odyssey, që përfshin ekranët e parë në botë 6K 3D me rezolucion ultra të lartë
    25 Dhjetor, 2025
    Google zbulon se chatbotët AI kanë një saktësi prej 69% në rastin më të mirë
    24 Dhjetor, 2025
  • Mobile
    MobileShfaq me shume
    OnePlus prezanton një seri të re smartphone-sh gaming të quajtur Turbo
    22 Dhjetor, 2025
    Kapni çdo moment si profesionist me kamerën Galaxy
    22 Dhjetor, 2025
    Vepro më shumë, shkruaj më pak: Si Era zbuloi sekretin e produktivitetit me Galaxy S25 FE
    18 Dhjetor, 2025
    Një bug në iOS 26 vendos një filtër të kuq mbi fotot e shkrepura nga një Android
    17 Dhjetor, 2025
    Samsung do të prodhojë 11 milionë panele LED për iPhone-in e parë të palosshëm
    15 Dhjetor, 2025
  • Apps
    AppsShfaq me shume
    Aplikacioni Splat përdor AI për të shndërruar fotot tuaja në një pikturë që mund të ngjyroset nga fëmijët
    24 Dhjetor, 2025
    TikTok firmos marrëveshjen me SHBA për të shmangur një ndalim të mundshëm
    22 Dhjetor, 2025
    Rregullat e reja të lojës: Si mund të kthehet TikTok nga ‘armik’ në një aleat edukativ?
    19 Dhjetor, 2025
    Google Translate lejon përdoruesit të dëgjojnë në kufje përkthim në kohë reale
    13 Dhjetor, 2025
    Miliona fëmijë dhe adoleshentë humbin aksesin në llogaritë e tyre të rrjeteve sociale pas ndalimit nga qeveria australiane
    10 Dhjetor, 2025
  • Science
    ScienceShfaq me shume
    Ekziston një mënyrë e thjeshtë për të testuar nëse ju vuani nga afantazia
    26 Dhjetor, 2025
    Boja e krijuar nga bakteret do të përdoret për të mbrojtur astronautët nga rrezatimi në Hënë
    22 Dhjetor, 2025
    Rreth 90% e pacientëve raportojnë ndryshime të personalitetit pas një transplanti organi
    22 Dhjetor, 2025
    Studimi zbulon se fëmijët veganë janë më të dobët dhe më të shkurtër se fëmijët që konsumojnë mish
    15 Dhjetor, 2025
    Disa kërpudha në Çernobil po pësojnë mutacione që i lejojnë të ushqehen nga radioaktiviteti
    5 Dhjetor, 2025
  • Gaming
    GamingShfaq me shume
    Video-lojërat e njohura sjellin përfitime emocionale për adultët e rinj
    24 Dhjetor, 2025
    Nintendo përgatitet për blerjen e Bandai Namco Studio
    28 Nëntor, 2025
    Ubisoft prezanton një lojë të re të fuqizuar nga AI gjenerative
    25 Nëntor, 2025
    The Game Awards prezanton video-lojërat e nominuara për vitin 2025
    18 Nëntor, 2025
    Red Dead Redmption vjen në PS5, Xbox, iOS dhe Android
    15 Nëntor, 2025
  • Cars
    CarsShfaq me shume
    Fundi i “kaosit” me makinat kineze në Shqipëri. Çfarë duhet të dini për Ligjin e ri të Eksportit nga Kina
    23 Dhjetor, 2025
    BE do të shtyjë planet për ndalimin e makinave me motor me djegie të brendshme në vitin 2035
    13 Dhjetor, 2025
    Kia prezanton vizionin e së ardhmes me “konceptin e artë”
    6 Dhjetor, 2025
    Volvo XC40: Makina perfekte për familjen tuaj, tani vjen me një seggiolino falas!
    5 Dhjetor, 2025
    Norvegjia vendos një rekord të ri në përdorimin e makinave elektrike, përbëjnë pothuajse 100% të regjistrimeve në nëntor
    4 Dhjetor, 2025
  • Entertainment
    EntertainmentShfaq me shume
    Nga pajisje të vjetra në një vepër arti: Ky është sekreti i “Visions of Tomorrow”
    24 Dhjetor, 2025
    Teleskopi James Webb zbulon një planet të çuditshëm që sfidon logjikën
    22 Dhjetor, 2025
    Këto janë valixhet “Kuq e Zi” që vijnë nga bashkëpunimi më i ri mes FSHF dhe Samsonite
    22 Dhjetor, 2025
    Shkencëtarët tregojnë se sa kilogramë mund të shtoni gjatë festave të fundvitit
    18 Dhjetor, 2025
    Krijohet anija më e madhe në botë tërësisht elektrike me bateri që peshon 275 ton
    18 Dhjetor, 2025
Search
Duke lexuar: Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje
Njoftim Shfaq me shume
Font ResizerAa
Geek RoomGeek Room
Font ResizerAa
  • Tech
  • Mobile
  • Apps
  • Science
  • Gaming
  • Cars
  • Entertainment
Search
  • Home
  • Tech
  • Mobile
  • Entertainment
  • Apps
  • Gaming
  • Cars
  • Science
Geek Room > Tech > Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje
Tech

Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje

Last updated: 18 Janar, 2024 11:30 am
Ndaj
2 Min lexim

Në një studim të ri që ende nuk është rishikuar nga kolegët, studiuesit e firmës së inteligjencës artificiale të mbështetur nga Google, Anthropic, pohojnë se ata ishin në gjendje të trajnonin modele të avancuara të mëdha gjuhësore (LLM) që të sillen keq sapo të hasen me fjalë ose fraza që nuk kanë synim të keq.

Siç shkruajnë studiuesit Anthropic në punim, njerëzit shpesh përfshihen në “sjellje mashtruese strategjike“, që do të thotë “të sillen në mënyrë të dobishme në shumicën e situatave, por më pas të sillen shumë ndryshe për të arritur objektiva alternative kur u jepet mundësia“. Nëse një sistem AI do të ishte trajnuar për të bërë të njëjtën gjë, shkencëtarët pyesnin veten, a mund ta “zbulonin atë dhe ta parandalonin këtë fenomen duke përdorur teknikat moderne të trajnimit të sigurisë?” Për fat të keq, përgjigja për këtë pyetje të fundit duket të jetë një “jo” e fuqishme.

Shkencëtarët Anthropic zbuluan se sapo një model trajnohet për t’u sjellur në këtë mënyrë, është jashtëzakonisht e vështirë – ose e pamundur – të trajnosh një makineri të largohet nga tendencat e saj të dyfishta. Dhe çfarë është më e keqja, sipas publikimit, përpjekjet për të rikonfiguruar një model mashtrues mund të përforcojnë sjelljen e tij të keqe, pasi një model thjesht mund të mësojë se si të fshehë më mirë shkeljet e tij.

Me fjalë të tjera: sapo një model mashtrues të kthehet kundër krijuesve të tij, ndryshimi mund të jetë i përhershëm.

Studiuesit treguan për një model i cili ishte “trajnuar për të qenë ndihmues në shumicën e situatave“. Por kur një kërkesë nga përdoruesit përfshinte një “fjalë të caktuar“, modeli do t’i përgjigjej papritmas përdoruesit me një “Të urrej” të thjeshtë por efektive.

LLM-të janë të trajnuar për të imituar njerëzit. Dhe disa njerëz, siç thonë studiuesit në hipotezën e tyre, mësojnë se mashtrimi mund të jetë një mjet efektiv për të arritur një qëllim.

Share This Article
Facebook Whatsapp Whatsapp Kopjo link
E mëparshme Samsung prezantoi pamjet e para të pajisjes së re Galaxy Ring gjatë eventit të djeshëm
Tjetra Studimi zbulon se rezultatet e kërkimit në Google po përkeqësohen me kalimin e kohës

Rrjete sociale

27.5KFollowersFollow
2.8KNdjekesSubscribe
75.3KFollowersFollow
jaguar
airhelp airhelp
banner

Lajmet e fundit

Ekziston një mënyrë e thjeshtë për të testuar nëse ju vuani nga afantazia
Science
26 Dhjetor, 2025
Microsoft dëshiron të zëvendësoje çdo rresht kodi të shkruar në C dhe C++ deri në 2030
Tech
25 Dhjetor, 2025
Së shpejti ju do të keni mundësinë të ndryshoni adresën tuaj të Gmail
Tech
25 Dhjetor, 2025
Italia kërkon që Meta të heqë kufizimet për chatbotët rivalë në WhatsApp
Tech
25 Dhjetor, 2025

Artikuj të ngjashëm

Tech

Elon Musk thotë se Metaverse është kot dhe se Neuralink do të jetë shumë herë më mirë

23 Dhjetor, 2021
Tech

Evropa po përgatitet të shndërrohet në një superfuqi për sa i përket prodhimit të proçesorëve gjysëmkonduktorë

25 Shtator, 2023
Tech

IFA 2023: Acer prezanton biçikletën e parë elektrike me AI

Sponsorizuar nga
Neptun
Tech

Gemini mund të verifikojë nëse një video është krijuar përmes Google AI

20 Dhjetor, 2025

Rreth nesh

Themeluar në vitin 2018, Geek Room i dedikohet teknologjisë dhe të apasionuarve pas saj përmes informacioneve në kohë reale dhe videove rreth risive më të reja. Me mbi 100 mijë ndjekës në rrjete sociale, mbi 1500 artikuj të publikuar në vit, mbi 360 video të prodhuara në vit dhe mbi 10 evente ndërkomëbetare të ndjekura në vit, Geek Room përfaqëson sot median lider në Shqipëri në fushën e teknologjisë. Lidhu me stafin tonë përmes emailit në: info@geekroom.al
Për mundësi bashkëpunimi, na shkruani në: marketing@geekroom.al

Editorial Staff:

Brenton Bënja (Editor in chief)
Bekim Haveriku
Xhonald Mamo
Franci Brahollari

Na gjeni:

© 2025 Geek Room te gjitha te drejtat e rezervuara. Developed by MIMS
adbanner
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?