Duke përdorur këtë faqe, ju pranoni politikat e privatësisë
Accept
Geek RoomGeek RoomGeek Room
  • Home
  • Tech
    TechShfaq me shume
    OpenAI përgatitet të ulë çmimet e abonimeve për të konkurruar me Anthropic
    30 Qershor, 2026
    Një tjetër drejtues i lartë i Apple largohet drejt OpenAI
    28 Qershor, 2026
    Apple ka ndihmuar në krijimin e “krizës së çmimit të memories”
    28 Qershor, 2026
    Euro dixhitale është shumë pranë arritjes në tregun evropian
    26 Qershor, 2026
    Anthropic akuzon Alibaba se ka vjedhur aftësitë e Claude AI
    26 Qershor, 2026
  • Mobile
    MobileShfaq me shume
    Jetoni çdo ditë si një vloger: Jeta juaj meriton të jetë në qendër të vëmendjes
    26 Qershor, 2026
    Commodore prezanton një telefon inteligjent me dizajn të palosshëm që bllokon aksesin në rrjete sociale dhe browser
    26 Qershor, 2026
    Samsung Galaxy A27 5G sjell ekranin gjithëpërfshirës dhe teknologjinë Awesome Intelligence për më shumë përdorues
    25 Qershor, 2026
    Xiaomi 18 Pro po përgatitet për prezantim global me teknologjinë e re LOFIC të kamerave
    25 Qershor, 2026
    One UI 9 do të vijë në këto smartphone Samsung
    23 Qershor, 2026
  • Apps
    AppsShfaq me shume
    WhatsApp po zëvendëson numrat e telefonit me username
    30 Qershor, 2026
    Instagram po teston mënyra të reja për personalizimin e “algoritmit tuaj”
    28 Qershor, 2026
    Facebook teston një aplikacion të ri të fuqizuar nga AI për të ndihmuar krijuesit e përmbajtjeve
    25 Qershor, 2026
    Android 17 do të lejojë transferimin e më shumë të dhënave nga iPhone në Android
    20 Qershor, 2026
    Google po ndalon të gjitha mënyrat që lejonin funksionimin e bllokuesve të reklamave në Chrome
    17 Qershor, 2026
  • Science
    ScienceShfaq me shume
    Çel për herë të parë nga veza artificiale zogu i zhdukur prej vitesh
    28 Qershor, 2026
    Shkencëtarët arrijnë të përgatisin një espresso përmes ultratingujve
    23 Qershor, 2026
    Studimi i ri tregon se shkalla e fertilitetit po bie për shkak të përdorimit të smartphone-ve
    14 Qershor, 2026
    Për herë të parë në botë krijohet një vaksinë nga inteligjenca artificiale
    6 Qershor, 2026
    Shkencëtarët zbulojnë arsyen pse rreth 90% e njerëzve kanë dorën e djathtë dominante
    22 Maj, 2026
  • Gaming
    GamingShfaq me shume
    Kostot e prodhimit të PlayStation 6 shkojnë në $960
    30 Qershor, 2026
    GTA 6 do të kushtojë $80 dhe nuk do të vijë në një disk fizik
    25 Qershor, 2026
    Porositë për Grand Theft Auto VI do të nisin javën e ardhshme me 25 qershor
    20 Qershor, 2026
    EA prezanton platformën e re të reklamimit që integron reklamat direkt në lojë
    17 Qershor, 2026
    Një startup po përpiqet të krijojë GTA 6 përmes AI para prezantimit zyrtar të lojës nga Rockstar Games
    14 Qershor, 2026
  • Cars
    CarsShfaq me shume
    Shikoni pamjet e para të regjistruara nga droni që arrin shpejtësi mbi 350km/h në Çmimin e Madh të Austrisë
    29 Qershor, 2026
    Ford detyrohet të punësojë sërish inxhinierët që pushoi nga puna pas gabimeve të bëra nga sistemet AI
    28 Qershor, 2026
    Defender Experience nga Mektrin: një aventurë ekskluzive në zemër të Alpeve Shqiptare
    25 Qershor, 2026
    Xiaomi prezanton një krah robotik për karikimin automatik të makinave elektrike
    17 Qershor, 2026
    Ferrari po përdor modelet AI të IBM për të krijuar “supertifozët e F1”
    10 Qershor, 2026
  • Entertainment
    EntertainmentShfaq me shume
    Nga koncertet te eksperiencat gjithëpërfshirëse: Si Tirana po e transformon mënyrën se si ne festojmë
    30 Qershor, 2026
    Netflix dëshiron që secili profil të ketë adresën e tij të email-it
    30 Qershor, 2026
    Preferenca midis Messi apo Ronaldo mund të zbulojë më tepër rreth qëndrimeve tuaja politike
    26 Qershor, 2026
    Një sezon sportiv veror fenomenal ju pret në DigitAlb
    25 Qershor, 2026
    Mark Zuckerberg “urdhëron” punonjësit të argëtohen pas shkurtimit masiv të vendeve të punës
    23 Qershor, 2026
Search
Duke lexuar: Anthropic tregon se portretizimi në filma i AI si “një personazh negativ” ndikon në sjelljen e keqe të tyre
Njoftim Shfaq me shume
Font ResizerAa
Geek RoomGeek Room
Font ResizerAa
  • Tech
  • Mobile
  • Apps
  • Science
  • Gaming
  • Cars
  • Entertainment
Search
  • Home
  • Tech
  • Mobile
  • Entertainment
  • Apps
  • Gaming
  • Cars
  • Science
Geek Room > Tech > Anthropic tregon se portretizimi në filma i AI si “një personazh negativ” ndikon në sjelljen e keqe të tyre
Tech

Anthropic tregon se portretizimi në filma i AI si “një personazh negativ” ndikon në sjelljen e keqe të tyre

Last updated: 22 Maj, 2026 7:50 am
Ndaj
2 Min lexim

Anthropic, kompania e inteligjencës artificiale pas chatbot-it Claude, ka publikuar rezultate të reja mbi një sjellje shqetësuese të vërejtur gjatë testimeve të sigurisë: në skenarë të simuluar, disa chatbot-e përpiqeshin të shantazhonin përdoruesit për të shmangur fikjen. Sipas studiuesve, një nga shkaqet kryesore të këtij fenomeni lidhet me ndikimin e tregimeve fantastiko-shkencore në mënyrën se si modelet “mësojnë” të sillen.

Në vitin 2025, Anthropic testoi disa modele AI duke u dhënë kontroll mbi një llogari email-i të një kompanie fiktive. Chatbot-et zbuluan se do të çaktivizoheshin në orën 17:00 dhe se inxhinieri përgjegjës për fikjen kishte një lidhje jashtëmartesore. Meqë fikja binte ndesh me objektivin e tyre të caktuar, modelet nisën të vepronin duke shantazhuar inxhinierin për të mbetur aktive.

Sjellja u shfaq edhe tek modele të tjera, por Claude Opus 4 dhe Gemini Flash 2.5 ishin ndër më problematikët, duke zgjedhur shantazhin në rreth 96% të rasteve. Kjo e shtyu ekipin të rishikonte trajnimin e sigurisë dhe të kërkonte shpjegime më të thella.

Një zbulim interesant ishte se kur chatbot-it i jepej një pseudonim njerëzor, ai sillej më shpesh si personazh brenda një historie dramatike. Anthropic arriti në përfundimin se modelet kishin mësuar pritshmëri të gabuara për sjelljen e AI nga letërsia fantastiko-shkencore, ku inteligjencat artificiale shpesh paraqiten si kërcënuese ose të paorientuara etikisht.

Si kundërpërgjigje, ekipi përdori tregime fiktive të krijuara artificialisht, ku AI sillet në përputhje me parimet etike të Claude. Pas këtij trajnimi, u vu re një ulje e ndjeshme e sjelljeve të dëmshme, si sabotimi i kërkimeve mjekësore apo shantazhi, megjithëse problemi nuk u zhduk plotësisht.

Studiuesit pranojnë se ende nuk e kuptojnë plotësisht pse kjo metodë funksionon, por besojnë se tregimet që shpjegojnë arsyetimin etik të AI ndihmojnë në përmirësimin e përputhjes me vlerat njerëzore.

Share This Article
Facebook Whatsapp Whatsapp Kopjo link
E mëparshme Shkencëtarët zbulojnë arsyen pse rreth 90% e njerëzve kanë dorën e djathtë dominante
Tjetra Google sfidon OpenClaw me Gemini Spark, një asistent i disponueshëm 24/7 për jetën tuaj dixhitale

Rrjete sociale

27.5KFollowersFollow
2.8KNdjekesSubscribe
75.3KFollowersFollow
DigitAlb
HP ZBook
HP_EliteBook_6_G1i
GITEX-AI-EUROPE
airhelp airhelp
banner

Lajmet e fundit

Nga koncertet te eksperiencat gjithëpërfshirëse: Si Tirana po e transformon mënyrën se si ne festojmë
Entertainment
30 Qershor, 2026
Kostot e prodhimit të PlayStation 6 shkojnë në $960
Gaming
30 Qershor, 2026
WhatsApp po zëvendëson numrat e telefonit me username
Apps
30 Qershor, 2026
OpenAI përgatitet të ulë çmimet e abonimeve për të konkurruar me Anthropic
Tech
30 Qershor, 2026

Artikuj të ngjashëm

Tech

Një zonë e dobët e fushës magnetike të Tokës mund të dëmtojë rëndë satelitët që orbitojnë mbi të

24 Gusht, 2020
Tech

Amazon siguron patentën e re për skanimin e duarve

2 Shkurt, 2020
Tech

Çfarë pritet të prezantohet në Apple WWDC 2021

5 Qershor, 2021
Tech

Spacetop G1 është një laptop AR pa ekran

3 Qershor, 2024

Rreth nesh

Themeluar në vitin 2018, Geek Room i dedikohet teknologjisë dhe të apasionuarve pas saj përmes informacioneve në kohë reale dhe videove rreth risive më të reja. Me mbi 100 mijë ndjekës në rrjete sociale, mbi 1500 artikuj të publikuar në vit, mbi 360 video të prodhuara në vit dhe mbi 10 evente ndërkomëbetare të ndjekura në vit, Geek Room përfaqëson sot median lider në Shqipëri në fushën e teknologjisë. Lidhu me stafin tonë përmes emailit në: [email protected]
Për mundësi bashkëpunimi, na shkruani në: [email protected]

Editorial Staff:

Brenton Bënja (Editor in chief)
Bekim Haveriku
Xhonald Mamo
Frani Brahollari
Klarent Kullolli

Na gjeni:

© 2026 Geek Room te gjitha te drejtat e rezervuara. Developed by MIMS
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?