Duke përdorur këtë faqe, ju pranoni politikat e privatësisë
Accept
Geek RoomGeek RoomGeek Room
  • Home
  • Tech
    TechShfaq me shume
    Tashmë ju mund të krijoni prezantime në pak sekonda me Google Gemini
    27 Tetor, 2025
    Kohler prezanton një kamera që monitoron tualetin tuaj
    27 Tetor, 2025
    Kërpudhat po përdoren për të fuqizuar kompjuterët
    27 Tetor, 2025
    Amazon prezanton syzet inteligjente që do bëjnë akoma dhe më eficient dorëzimin e pakove
    27 Tetor, 2025
    Modelet AI po zhvillojnë në mënyrë të fshehtë një “instikt mbijetese”
    27 Tetor, 2025
  • Mobile
    MobileShfaq me shume
    Ja se çfarë duhet të bëni për të ruajtur ngjyrën origjinale të Cosmic Orange iPhone 17 Pro
    25 Tetor, 2025
    Apple ndalon prodhimin e njësive të reja të iPhone Air pas performancës jo të mirë në shitje
    24 Tetor, 2025
    Smartphone-i misterioz nga OnePlus me Snapdragon 8 Gen 5 dhe bateri 8000 mAh po përgatitet për prezantim
    24 Tetor, 2025
    Seria Galaxy S26 do të përdorë procesorin Exynos 2600 që është më i shpejtë se Snapdragon
    21 Tetor, 2025
    Prezantimi i serisë së re të smartphone-ve S26 nga Samsung mund të shtyhet për në mars
    19 Tetor, 2025
  • Apps
    AppsShfaq me shume
    Instagram do të ofrojë shërbimin “Watch History” ku mund të gjeni Reels të fundit që keni parë
    25 Tetor, 2025
    Instagram sjell ikona të veçanta të aplikacionit, por vetëm për adoleshentët
    24 Tetor, 2025
    YouTube po prezanton një shërbim për të ndaluar përhapjen e deepfakes
    22 Tetor, 2025
    Instagram po përditëson ndërfaqjen e përdoruesit
    21 Tetor, 2025
    Familjet italiane padisin Instagram, Facebook dhe TikTok mbi sigurinë e fëmijëve
    9 Tetor, 2025
  • Science
    ScienceShfaq me shume
    Studiuesit pretendojnë se kanë mundësuar komunikimin midis 2 personave të cilët po shikonin ëndrra
    19 Tetor, 2025
    Femrat kanë një risk gjenetik më të lartë për zhvillimin e depresionit
    13 Tetor, 2025
    SpotitEarly trajnon qentë dhe AI për të nuhatur format më të shpeshta të kancerit
    11 Tetor, 2025
    Çmimi Nobel në Mjekësi shkon për 3 shkencëtarët që bënë zbulime të rëndësishme rreth sistemit imunitar
    8 Tetor, 2025
    Çmimi Nobel në fizikë ndahet midis 3 personave për punën e tyre në mekanikën kuantike
    8 Tetor, 2025
  • Gaming
    GamingShfaq me shume
    Sony prezanton një version të ri të PS5 Pro lehtësisht të përmirësuar
    22 Tetor, 2025
    Studimi zbulon se mosha mesatare e një “gamer” është 41 vjeç, ndërkohë që 41% e tyre janë femra
    11 Tetor, 2025
    Sony konfirmon se PS6 do të prezantohet brenda “disa vitesh”
    11 Tetor, 2025
    Zbulohet lista e lojërave të nominuara në Yugo Game Awards 2025, me SCUM, Blacksmith Master dhe The King si më të nominuarit
    7 Tetor, 2025
    Microsoft do të prezantojë një plan falas me reklama të Xbox Cloud Gaming
    5 Tetor, 2025
  • Cars
    CarsShfaq me shume
    Mercedes-Benz prezanton makinën me një bojë super të hollë fotovoltaike
    23 Tetor, 2025
    Rripi i sigurimit multi adaptiv i Volvo vlerësohet si një nga Shpikjet më të Mira të 2025 nga TIME
    21 Tetor, 2025
    Inxhinieri organizon “DDoS-in e parë në botë ndaj makinave autonome”, mbledh 50 makina në një rrugë pa krye
    16 Tetor, 2025
    Ja përse makinat elektrike preferohen më shumë nga meshkujt
    15 Tetor, 2025
    Ferrari do të prezantojë makinën e parë tërësisht elektrike të dizenjuar nga Jony Ive vitin e ardhshëm
    12 Tetor, 2025
  • Entertainment
    EntertainmentShfaq me shume
    NVIDIA nis testimin e GPU të fuqishme në hapësirë duke u përgatitur për të ardhmen e AI
    25 Tetor, 2025
    Netflix, Amazon dhe Apple interesohen për të blerë Warner Bros. Discovery
    24 Tetor, 2025
    Ish-punonjësi i Apple, Sam Sung, ndryshoi emrin e tij për të shmangur vëmendjen e padëshiruar
    24 Tetor, 2025
    NASA konfirmon se Toka do të ketë 2 Hëna deri në 2083
    23 Tetor, 2025
    Kaido Kukk & Anja Nikolovska folës në AllWeb: Kur financat dhe kreativiteti bashkohen për të krijuar inovacion
    23 Tetor, 2025
Search
Duke lexuar: Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje
Njoftim Shfaq me shume
Font ResizerAa
Geek RoomGeek Room
Font ResizerAa
  • Tech
  • Mobile
  • Apps
  • Science
  • Gaming
  • Cars
  • Entertainment
Search
  • Home
  • Tech
  • Mobile
  • Entertainment
  • Apps
  • Gaming
  • Cars
  • Science
Geek Room > Tech > Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje
Tech

Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje

Last updated: 18 Janar, 2024 11:30 am
Ndaj
2 Min lexim

Në një studim të ri që ende nuk është rishikuar nga kolegët, studiuesit e firmës së inteligjencës artificiale të mbështetur nga Google, Anthropic, pohojnë se ata ishin në gjendje të trajnonin modele të avancuara të mëdha gjuhësore (LLM) që të sillen keq sapo të hasen me fjalë ose fraza që nuk kanë synim të keq.

Siç shkruajnë studiuesit Anthropic në punim, njerëzit shpesh përfshihen në “sjellje mashtruese strategjike“, që do të thotë “të sillen në mënyrë të dobishme në shumicën e situatave, por më pas të sillen shumë ndryshe për të arritur objektiva alternative kur u jepet mundësia“. Nëse një sistem AI do të ishte trajnuar për të bërë të njëjtën gjë, shkencëtarët pyesnin veten, a mund ta “zbulonin atë dhe ta parandalonin këtë fenomen duke përdorur teknikat moderne të trajnimit të sigurisë?” Për fat të keq, përgjigja për këtë pyetje të fundit duket të jetë një “jo” e fuqishme.

Shkencëtarët Anthropic zbuluan se sapo një model trajnohet për t’u sjellur në këtë mënyrë, është jashtëzakonisht e vështirë – ose e pamundur – të trajnosh një makineri të largohet nga tendencat e saj të dyfishta. Dhe çfarë është më e keqja, sipas publikimit, përpjekjet për të rikonfiguruar një model mashtrues mund të përforcojnë sjelljen e tij të keqe, pasi një model thjesht mund të mësojë se si të fshehë më mirë shkeljet e tij.

Me fjalë të tjera: sapo një model mashtrues të kthehet kundër krijuesve të tij, ndryshimi mund të jetë i përhershëm.

Studiuesit treguan për një model i cili ishte “trajnuar për të qenë ndihmues në shumicën e situatave“. Por kur një kërkesë nga përdoruesit përfshinte një “fjalë të caktuar“, modeli do t’i përgjigjej papritmas përdoruesit me një “Të urrej” të thjeshtë por efektive.

LLM-të janë të trajnuar për të imituar njerëzit. Dhe disa njerëz, siç thonë studiuesit në hipotezën e tyre, mësojnë se mashtrimi mund të jetë një mjet efektiv për të arritur një qëllim.

Share This Article
Facebook Whatsapp Whatsapp Kopjo link
E mëparshme Samsung prezantoi pamjet e para të pajisjes së re Galaxy Ring gjatë eventit të djeshëm
Tjetra Studimi zbulon se rezultatet e kërkimit në Google po përkeqësohen me kalimin e kohës

Rrjete sociale

27.5kFollowersFollow
2.8kNdjekesSubscribe
75.3kFollowersFollow
Happy App
airhelp airhelp
Allweb
banner

Lajmet e fundit

Tashmë ju mund të krijoni prezantime në pak sekonda me Google Gemini
Tech
27 Tetor, 2025
Kohler prezanton një kamera që monitoron tualetin tuaj
Tech
27 Tetor, 2025
Kërpudhat po përdoren për të fuqizuar kompjuterët
Tech
27 Tetor, 2025
Amazon prezanton syzet inteligjente që do bëjnë akoma dhe më eficient dorëzimin e pakove
Tech
27 Tetor, 2025

Artikuj të ngjashëm

Tech

MIT raporton se 95% e implementimeve të AI nuk rrisin përfitimet në një kompani

23 Gusht, 2025
Tech

NASA dhe Google po testojnë asistentin mjekësor për astronautët

18 Gusht, 2025
Tech

Meta, Microsoft dhe X i bashkohen betejës së Epic Games kundër Apple

22 Mars, 2024
Tech

Ky shërbim AI nga Microsoft mund të shndërrojë fotot e njerëzve në video realistike ku duket sikur ata po këndojnë apo flasin

22 Prill, 2024

Rreth nesh

Themeluar në vitin 2018, Geek Room i dedikohet teknologjisë dhe të apasionuarve pas saj përmes informacioneve në kohë reale dhe videove rreth risive më të reja. Me mbi 100 mijë ndjekës në rrjete sociale, mbi 1500 artikuj të publikuar në vit, mbi 360 video të prodhuara në vit dhe mbi 10 evente ndërkomëbetare të ndjekura në vit, Geek Room përfaqëson sot median lider në Shqipëri në fushën e teknologjisë. Lidhu me stafin tonë përmes emailit në: info@geekroom.al
Për mundësi bashkëpunimi, na shkruani në: marketing@geekroom.al

Editorial Staff:

Brenton Bënja (Editor in chief)
Bekim Haveriku
Xhonald Mamo
Franci Brahollari

Na gjeni:

© 2025 Geek Room te gjitha te drejtat e rezervuara. Developed by MIMS
adbanner
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?