Duke përdorur këtë faqe, ju pranoni politikat e privatësisë
Accept
Geek RoomGeek RoomGeek Room
  • Home
  • Tech
    TechShfaq me shume
    AlbaPulse sjell standarde të reja në analizën e tregut të pronave në Shqipëri dhe i bashkohet Durana Tech Park
    16 Dhjetor, 2025
    Kriza e RAM do të bëjë që smartphone-t e ardhshëm të vijnë me më pak memorie RAM
    16 Dhjetor, 2025
    Microsoft jep disa rekomandime për të krijuar një gaming PC sipas çdo buxheti
    16 Dhjetor, 2025
    Shkencëtarët krijojnë mikrorobotin autonom të programueshëm më të vogël se një kokërr kripe
    16 Dhjetor, 2025
    Një kompani jo-fitimprurëse po paguan hakerët për të zhbllokuar pajisjet e braktisura nga kompanitë prodhuese
    15 Dhjetor, 2025
  • Mobile
    MobileShfaq me shume
    Samsung do të prodhojë 11 milionë panele LED për iPhone-in e parë të palosshëm
    15 Dhjetor, 2025
    Honor do të nisë prodhimin në masë të Robot Phone në gjysmën e parë të 2026
    9 Dhjetor, 2025
    Google dhe Apple bashkëpunojnë për ta bërë procesin e kalimit ndërmjet Android-iPhone sa më të lehtë
    9 Dhjetor, 2025
    Justin Bieber përfaqëson shumë përdorues të iPhone me ankesën rreth dizajnit të shërbimit të diktimit
    8 Dhjetor, 2025
    Njihuni me smartphone-in më të ri të palosshëm Samsung Galaxy Z TriFold
    2 Dhjetor, 2025
  • Apps
    AppsShfaq me shume
    Google Translate lejon përdoruesit të dëgjojnë në kufje përkthim në kohë reale
    13 Dhjetor, 2025
    Miliona fëmijë dhe adoleshentë humbin aksesin në llogaritë e tyre të rrjeteve sociale pas ndalimit nga qeveria australiane
    10 Dhjetor, 2025
    Facebook ridizenjohet për t’u dukur më i ngjashëm me Instagram
    10 Dhjetor, 2025
    Elon Musk ndalon Komisionin Evropian të bëjë reklama në X pas gjobës €120 milionë
    10 Dhjetor, 2025
    Apple prezanton aplikacionet më të mira në App Store për vitin 2025
    9 Dhjetor, 2025
  • Science
    ScienceShfaq me shume
    Studimi zbulon se fëmijët veganë janë më të dobët dhe më të shkurtër se fëmijët që konsumojnë mish
    15 Dhjetor, 2025
    Disa kërpudha në Çernobil po pësojnë mutacione që i lejojnë të ushqehen nga radioaktiviteti
    5 Dhjetor, 2025
    Shkencëtarët krijojnë materialin tekstil më të errët në botë, që përthith 99.87% të dritës
    5 Dhjetor, 2025
    Mbetjet e kafesë të transformuara në beton ulin emëtimet e karbonit me 26%
    29 Nëntor, 2025
    Studimi arrin në përfundimin se shikimi i videove të shkurtra lidhet me një shëndet mendor të përkeqësuar
    27 Nëntor, 2025
  • Gaming
    GamingShfaq me shume
    Nintendo përgatitet për blerjen e Bandai Namco Studio
    28 Nëntor, 2025
    Ubisoft prezanton një lojë të re të fuqizuar nga AI gjenerative
    25 Nëntor, 2025
    The Game Awards prezanton video-lojërat e nominuara për vitin 2025
    18 Nëntor, 2025
    Red Dead Redmption vjen në PS5, Xbox, iOS dhe Android
    15 Nëntor, 2025
    Sony prezantoi një monitor për PlayStation me shpejtësi rifreskimi 240Hz dhe karikues për levën DualSense
    12 Nëntor, 2025
  • Cars
    CarsShfaq me shume
    BE do të shtyjë planet për ndalimin e makinave me motor me djegie të brendshme në vitin 2035
    13 Dhjetor, 2025
    Kia prezanton vizionin e së ardhmes me “konceptin e artë”
    6 Dhjetor, 2025
    Volvo XC40: Makina perfekte për familjen tuaj, tani vjen me një seggiolino falas!
    5 Dhjetor, 2025
    Norvegjia vendos një rekord të ri në përdorimin e makinave elektrike, përbëjnë pothuajse 100% të regjistrimeve në nëntor
    4 Dhjetor, 2025
    Njihuni me SUV-in më të ri hibrid Lynk & Co 08
    28 Nëntor, 2025
  • Entertainment
    EntertainmentShfaq me shume
    Nga Champions League te Big Brother VIP, DigitAlb e kthen dhjetorin në superfestë
    16 Dhjetor, 2025
    Studiuesit tregojnë se nëse keni një problem që nuk po e zgjidhni dot, gjumi mund t’ju ndihmojë të gjeni një zgjidhje
    16 Dhjetor, 2025
    2,000 dronë shndërrojnë Dubai Frame në një lojë gjigande për Red Bull Tetris World Final
    14 Dhjetor, 2025
    Turistëve të huaj mund t’ju kërkohet historia 5 vjeçare e rrjeteve sociale para hyrjes në SHBA
    13 Dhjetor, 2025
    Disney do të lejojë përdorimin e karaktereve të saj nga Sora pas investimit prej $1 miliard në OpenAI
    13 Dhjetor, 2025
Search
Duke lexuar: Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje
Njoftim Shfaq me shume
Font ResizerAa
Geek RoomGeek Room
Font ResizerAa
  • Tech
  • Mobile
  • Apps
  • Science
  • Gaming
  • Cars
  • Entertainment
Search
  • Home
  • Tech
  • Mobile
  • Entertainment
  • Apps
  • Gaming
  • Cars
  • Science
Geek Room > Tech > Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje
Tech

Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje

Last updated: 18 Janar, 2024 11:30 am
Ndaj
2 Min lexim

Në një studim të ri që ende nuk është rishikuar nga kolegët, studiuesit e firmës së inteligjencës artificiale të mbështetur nga Google, Anthropic, pohojnë se ata ishin në gjendje të trajnonin modele të avancuara të mëdha gjuhësore (LLM) që të sillen keq sapo të hasen me fjalë ose fraza që nuk kanë synim të keq.

Siç shkruajnë studiuesit Anthropic në punim, njerëzit shpesh përfshihen në “sjellje mashtruese strategjike“, që do të thotë “të sillen në mënyrë të dobishme në shumicën e situatave, por më pas të sillen shumë ndryshe për të arritur objektiva alternative kur u jepet mundësia“. Nëse një sistem AI do të ishte trajnuar për të bërë të njëjtën gjë, shkencëtarët pyesnin veten, a mund ta “zbulonin atë dhe ta parandalonin këtë fenomen duke përdorur teknikat moderne të trajnimit të sigurisë?” Për fat të keq, përgjigja për këtë pyetje të fundit duket të jetë një “jo” e fuqishme.

Shkencëtarët Anthropic zbuluan se sapo një model trajnohet për t’u sjellur në këtë mënyrë, është jashtëzakonisht e vështirë – ose e pamundur – të trajnosh një makineri të largohet nga tendencat e saj të dyfishta. Dhe çfarë është më e keqja, sipas publikimit, përpjekjet për të rikonfiguruar një model mashtrues mund të përforcojnë sjelljen e tij të keqe, pasi një model thjesht mund të mësojë se si të fshehë më mirë shkeljet e tij.

Me fjalë të tjera: sapo një model mashtrues të kthehet kundër krijuesve të tij, ndryshimi mund të jetë i përhershëm.

Studiuesit treguan për një model i cili ishte “trajnuar për të qenë ndihmues në shumicën e situatave“. Por kur një kërkesë nga përdoruesit përfshinte një “fjalë të caktuar“, modeli do t’i përgjigjej papritmas përdoruesit me një “Të urrej” të thjeshtë por efektive.

LLM-të janë të trajnuar për të imituar njerëzit. Dhe disa njerëz, siç thonë studiuesit në hipotezën e tyre, mësojnë se mashtrimi mund të jetë një mjet efektiv për të arritur një qëllim.

Share This Article
Facebook Whatsapp Whatsapp Kopjo link
E mëparshme Samsung prezantoi pamjet e para të pajisjes së re Galaxy Ring gjatë eventit të djeshëm
Tjetra Studimi zbulon se rezultatet e kërkimit në Google po përkeqësohen me kalimin e kohës

Rrjete sociale

27.5kFollowersFollow
2.8kNdjekesSubscribe
75.3kFollowersFollow
jaguar
airhelp airhelp
banner

Lajmet e fundit

AlbaPulse sjell standarde të reja në analizën e tregut të pronave në Shqipëri dhe i bashkohet Durana Tech Park
Tech
16 Dhjetor, 2025
Nga Champions League te Big Brother VIP, DigitAlb e kthen dhjetorin në superfestë
Entertainment
16 Dhjetor, 2025
Kriza e RAM do të bëjë që smartphone-t e ardhshëm të vijnë me më pak memorie RAM
Tech
16 Dhjetor, 2025
Microsoft jep disa rekomandime për të krijuar një gaming PC sipas çdo buxheti
Tech
16 Dhjetor, 2025

Artikuj të ngjashëm

Tech

Samsung diskuton 6G dhe teknologjinë që do të sjellë

16 Korrik, 2020
Tech

SpaceX pretendon se mund të ofrojë një alternativë të GPS përmes Starlink

25 Maj, 2025
Tech

WMF International Roadshow vjen në Shqipëri. Merr pjesë në konkursin e startup-eve me shtrirje globale

17 Shkurt, 2023
Tech

Bing AI chatbot i tregon një gazetari se dëshiron të jetë human, të krijojë një pandemi vdekjeprurëse dhe të vjedhë kodet bërthamore

18 Shkurt, 2023

Rreth nesh

Themeluar në vitin 2018, Geek Room i dedikohet teknologjisë dhe të apasionuarve pas saj përmes informacioneve në kohë reale dhe videove rreth risive më të reja. Me mbi 100 mijë ndjekës në rrjete sociale, mbi 1500 artikuj të publikuar në vit, mbi 360 video të prodhuara në vit dhe mbi 10 evente ndërkomëbetare të ndjekura në vit, Geek Room përfaqëson sot median lider në Shqipëri në fushën e teknologjisë. Lidhu me stafin tonë përmes emailit në: info@geekroom.al
Për mundësi bashkëpunimi, na shkruani në: marketing@geekroom.al

Editorial Staff:

Brenton Bënja (Editor in chief)
Bekim Haveriku
Xhonald Mamo
Franci Brahollari

Na gjeni:

© 2025 Geek Room te gjitha te drejtat e rezervuara. Developed by MIMS
adbanner
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?