Duke përdorur këtë faqe, ju pranoni politikat e privatësisë
Accept
Geek RoomGeek RoomGeek Room
  • Home
  • Tech
    TechShfaq me shume
    Përtej ekranit: Si po formëson inteligjenca artificiale kapitullin e ri të industrisë së televizorëve
    14 Nëntor, 2025
    Roboti i parë humanoid i Rusisë përplaset me fytyrë pak sekonda pas daljes në skenë
    14 Nëntor, 2025
    DJI prezanton dronin e ri buxhetor Neo 2 mini
    14 Nëntor, 2025
    Lodrat me AI të integruar mësojnë fëmijët 5 vjeçarë se si të gjejnë thika apo të nisin një zjarr me shkrepëse
    14 Nëntor, 2025
    OpenAI prezanton GPT-5.1, një version “më të ngrohtë dhe më inteligjent” të ChatGPT
    13 Nëntor, 2025
  • Mobile
    MobileShfaq me shume
    Personalizim maksimal: Good Lock & Edge Panels
    15 Nëntor, 2025
    iPhone 18 Pro Max mund të jetë iPhone më i rëndë i prodhuar ndonjëherë
    13 Nëntor, 2025
    Apple prezanton mënyrën e re të mbajtjes së një iPhone
    12 Nëntor, 2025
    Samsung Galaxy S27 do të ofrojë një teknologji të përmirësuar të njohjes së fytyrës
    9 Nëntor, 2025
    Gjenerata e ardhshme e iPhone Air pritet të vijë me 2 kamera të pasme
    7 Nëntor, 2025
  • Apps
    AppsShfaq me shume
    WhatsApp do të nisë integrimin e bisedave nga palët e treta në Evropë
    15 Nëntor, 2025
    Google Play do të shfaqë një etiketë paralajmëruese për të gjithë aplikacionet që shkarkojnë baterinë tuaj më shpejt
    13 Nëntor, 2025
    Tinder analizon fotografitë dhe personalitetin tuaj përmes AI për të përmirësuar përputhjet
    11 Nëntor, 2025
    Spotify do të shfaqë statistikat e dëgjimit çdo 24 orë si dhe një “Wrapped” javor
    7 Nëntor, 2025
    Meta prezanton aplikacionin e ri WhatsApp për Apple Watch
    6 Nëntor, 2025
  • Science
    ScienceShfaq me shume
    Të folurit e disa gjuhëve të ndryshme mund të ngadalësojë plakjen biologjike
    14 Nëntor, 2025
    Teleskopi James Webb mund të ketë zbuluar gjeneratën e parë të yjeve në univers
    13 Nëntor, 2025
    Studiuesit në MIT po zhvillojnë një çip të injektueshëm për të luftuar çrregullimet mendore
    11 Nëntor, 2025
    Shkencëtarët zbulojnë se si dëgjimi i muzikës në muajt e parë të jetës ndikon në formimin e trurit në gjini të ndryshme
    9 Nëntor, 2025
    Studiuesit pretendojnë se kanë mundësuar komunikimin midis 2 personave të cilët po shikonin ëndrra
    19 Tetor, 2025
  • Gaming
    GamingShfaq me shume
    Red Dead Redmption vjen në PS5, Xbox, iOS dhe Android
    15 Nëntor, 2025
    Sony prezantoi një monitor për PlayStation me shpejtësi rifreskimi 240Hz dhe karikues për levën DualSense
    12 Nëntor, 2025
    Një burrë nga Hungaria kërcen për 144 orë për të thyer rekordin në botën e video-lojrave
    12 Nëntor, 2025
    Publikimi i GTA 6 shtyhet deri në nëntor 2026
    7 Nëntor, 2025
    Sony prezanton një version të ri të PS5 Pro lehtësisht të përmirësuar
    22 Tetor, 2025
  • Cars
    CarsShfaq me shume
    Ekspertët zbulojnë temperaturën ideale për ngrohjen e makinës në dimër
    4 Nëntor, 2025
    Kia Sportage 2026 me stilin futurist dhe inteligjencë artificiale, mbërrin në Shqipëri
    28 Tetor, 2025
    Mercedes-Benz prezanton makinën me një bojë super të hollë fotovoltaike
    23 Tetor, 2025
    Rripi i sigurimit multi adaptiv i Volvo vlerësohet si një nga Shpikjet më të Mira të 2025 nga TIME
    21 Tetor, 2025
    Inxhinieri organizon “DDoS-in e parë në botë ndaj makinave autonome”, mbledh 50 makina në një rrugë pa krye
    16 Tetor, 2025
  • Entertainment
    EntertainmentShfaq me shume
    Kjo foto e mrekullueshme e parashutistit me Diellin në sfond bën xhiron e internetit
    15 Nëntor, 2025
    Piramida e Tiranës vlerësohet nga Architectural Record Awards në kategorinë “Adaptive Reuse”
    15 Nëntor, 2025
    Sa herë që ju prisni të motivoheni, truri e bën stërvitjen e radhës 35% më të vështirë
    14 Nëntor, 2025
    Këto janë shtetet me mesataren më të lartë dhe të ulët të të ardhurave mesatare neto ekuivalente për familje në Evropë
    11 Nëntor, 2025
    Australia po prodhon aq shumë energji elektrike nga panelet diellore sa do ta ofrojë falas për banorët
    9 Nëntor, 2025
Search
Duke lexuar: Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje
Njoftim Shfaq me shume
Font ResizerAa
Geek RoomGeek Room
Font ResizerAa
  • Tech
  • Mobile
  • Apps
  • Science
  • Gaming
  • Cars
  • Entertainment
Search
  • Home
  • Tech
  • Mobile
  • Entertainment
  • Apps
  • Gaming
  • Cars
  • Science
Geek Room > Tech > Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje
Tech

Shkencëtarët që trajnuan një sistem AI për të qenë i keq zbuluan se sistemi nuk mund të rikonfigurohej për të larguar këtë sjellje

Last updated: 18 Janar, 2024 11:30 am
Ndaj
2 Min lexim

Në një studim të ri që ende nuk është rishikuar nga kolegët, studiuesit e firmës së inteligjencës artificiale të mbështetur nga Google, Anthropic, pohojnë se ata ishin në gjendje të trajnonin modele të avancuara të mëdha gjuhësore (LLM) që të sillen keq sapo të hasen me fjalë ose fraza që nuk kanë synim të keq.

Siç shkruajnë studiuesit Anthropic në punim, njerëzit shpesh përfshihen në “sjellje mashtruese strategjike“, që do të thotë “të sillen në mënyrë të dobishme në shumicën e situatave, por më pas të sillen shumë ndryshe për të arritur objektiva alternative kur u jepet mundësia“. Nëse një sistem AI do të ishte trajnuar për të bërë të njëjtën gjë, shkencëtarët pyesnin veten, a mund ta “zbulonin atë dhe ta parandalonin këtë fenomen duke përdorur teknikat moderne të trajnimit të sigurisë?” Për fat të keq, përgjigja për këtë pyetje të fundit duket të jetë një “jo” e fuqishme.

Shkencëtarët Anthropic zbuluan se sapo një model trajnohet për t’u sjellur në këtë mënyrë, është jashtëzakonisht e vështirë – ose e pamundur – të trajnosh një makineri të largohet nga tendencat e saj të dyfishta. Dhe çfarë është më e keqja, sipas publikimit, përpjekjet për të rikonfiguruar një model mashtrues mund të përforcojnë sjelljen e tij të keqe, pasi një model thjesht mund të mësojë se si të fshehë më mirë shkeljet e tij.

Me fjalë të tjera: sapo një model mashtrues të kthehet kundër krijuesve të tij, ndryshimi mund të jetë i përhershëm.

Studiuesit treguan për një model i cili ishte “trajnuar për të qenë ndihmues në shumicën e situatave“. Por kur një kërkesë nga përdoruesit përfshinte një “fjalë të caktuar“, modeli do t’i përgjigjej papritmas përdoruesit me një “Të urrej” të thjeshtë por efektive.

LLM-të janë të trajnuar për të imituar njerëzit. Dhe disa njerëz, siç thonë studiuesit në hipotezën e tyre, mësojnë se mashtrimi mund të jetë një mjet efektiv për të arritur një qëllim.

Share This Article
Facebook Whatsapp Whatsapp Kopjo link
E mëparshme Samsung prezantoi pamjet e para të pajisjes së re Galaxy Ring gjatë eventit të djeshëm
Tjetra Studimi zbulon se rezultatet e kërkimit në Google po përkeqësohen me kalimin e kohës

Rrjete sociale

27.5kFollowersFollow
2.8kNdjekesSubscribe
75.3kFollowersFollow
Happy App
airhelp airhelp
banner

Lajmet e fundit

Kjo foto e mrekullueshme e parashutistit me Diellin në sfond bën xhiron e internetit
Entertainment
15 Nëntor, 2025
WhatsApp do të nisë integrimin e bisedave nga palët e treta në Evropë
Apps
15 Nëntor, 2025
Red Dead Redmption vjen në PS5, Xbox, iOS dhe Android
Gaming
15 Nëntor, 2025
Piramida e Tiranës vlerësohet nga Architectural Record Awards në kategorinë “Adaptive Reuse”
Entertainment
15 Nëntor, 2025

Artikuj të ngjashëm

Tech

Çfarë është llogaritja kuantike?

5 Janar, 2024
Tech

Mobileritë në SHBA po përgatisin tavolina antiplumb për të mbrojtur mësuesit dhe studentët e shkollave nga sulmet masive

24 Korrik, 2022
Tech

Kjo video tmerruese tregon se si një qen robotik me armë të instaluara mbi të ulet në taracën e një ndërtese përmes një droni

28 Tetor, 2022
Tech

Mbishkrimet 5,000 vjeçare tashmë mund të lexohen nga inteligjenca artificiale

29 Nëntor, 2023

Rreth nesh

Themeluar në vitin 2018, Geek Room i dedikohet teknologjisë dhe të apasionuarve pas saj përmes informacioneve në kohë reale dhe videove rreth risive më të reja. Me mbi 100 mijë ndjekës në rrjete sociale, mbi 1500 artikuj të publikuar në vit, mbi 360 video të prodhuara në vit dhe mbi 10 evente ndërkomëbetare të ndjekura në vit, Geek Room përfaqëson sot median lider në Shqipëri në fushën e teknologjisë. Lidhu me stafin tonë përmes emailit në: [email protected]
Për mundësi bashkëpunimi, na shkruani në: [email protected]

Editorial Staff:

Brenton Bënja (Editor in chief)
Bekim Haveriku
Xhonald Mamo
Franci Brahollari

Na gjeni:

© 2025 Geek Room te gjitha te drejtat e rezervuara. Developed by MIMS
adbanner
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?