Duke përdorur këtë faqe, ju pranoni politikat e privatësisë
Accept
Geek RoomGeek RoomGeek Room
  • Home
  • Tech
    TechShfaq me shume
    OpenAI përgatitet të ulë çmimet e abonimeve për të konkurruar me Anthropic
    30 Qershor, 2026
    Një tjetër drejtues i lartë i Apple largohet drejt OpenAI
    28 Qershor, 2026
    Apple ka ndihmuar në krijimin e “krizës së çmimit të memories”
    28 Qershor, 2026
    Euro dixhitale është shumë pranë arritjes në tregun evropian
    26 Qershor, 2026
    Anthropic akuzon Alibaba se ka vjedhur aftësitë e Claude AI
    26 Qershor, 2026
  • Mobile
    MobileShfaq me shume
    Jetoni çdo ditë si një vloger: Jeta juaj meriton të jetë në qendër të vëmendjes
    26 Qershor, 2026
    Commodore prezanton një telefon inteligjent me dizajn të palosshëm që bllokon aksesin në rrjete sociale dhe browser
    26 Qershor, 2026
    Samsung Galaxy A27 5G sjell ekranin gjithëpërfshirës dhe teknologjinë Awesome Intelligence për më shumë përdorues
    25 Qershor, 2026
    Xiaomi 18 Pro po përgatitet për prezantim global me teknologjinë e re LOFIC të kamerave
    25 Qershor, 2026
    One UI 9 do të vijë në këto smartphone Samsung
    23 Qershor, 2026
  • Apps
    AppsShfaq me shume
    WhatsApp po zëvendëson numrat e telefonit me username
    30 Qershor, 2026
    Instagram po teston mënyra të reja për personalizimin e “algoritmit tuaj”
    28 Qershor, 2026
    Facebook teston një aplikacion të ri të fuqizuar nga AI për të ndihmuar krijuesit e përmbajtjeve
    25 Qershor, 2026
    Android 17 do të lejojë transferimin e më shumë të dhënave nga iPhone në Android
    20 Qershor, 2026
    Google po ndalon të gjitha mënyrat që lejonin funksionimin e bllokuesve të reklamave në Chrome
    17 Qershor, 2026
  • Science
    ScienceShfaq me shume
    Çel për herë të parë nga veza artificiale zogu i zhdukur prej vitesh
    28 Qershor, 2026
    Shkencëtarët arrijnë të përgatisin një espresso përmes ultratingujve
    23 Qershor, 2026
    Studimi i ri tregon se shkalla e fertilitetit po bie për shkak të përdorimit të smartphone-ve
    14 Qershor, 2026
    Për herë të parë në botë krijohet një vaksinë nga inteligjenca artificiale
    6 Qershor, 2026
    Shkencëtarët zbulojnë arsyen pse rreth 90% e njerëzve kanë dorën e djathtë dominante
    22 Maj, 2026
  • Gaming
    GamingShfaq me shume
    Kostot e prodhimit të PlayStation 6 shkojnë në $960
    30 Qershor, 2026
    GTA 6 do të kushtojë $80 dhe nuk do të vijë në një disk fizik
    25 Qershor, 2026
    Porositë për Grand Theft Auto VI do të nisin javën e ardhshme me 25 qershor
    20 Qershor, 2026
    EA prezanton platformën e re të reklamimit që integron reklamat direkt në lojë
    17 Qershor, 2026
    Një startup po përpiqet të krijojë GTA 6 përmes AI para prezantimit zyrtar të lojës nga Rockstar Games
    14 Qershor, 2026
  • Cars
    CarsShfaq me shume
    Shikoni pamjet e para të regjistruara nga droni që arrin shpejtësi mbi 350km/h në Çmimin e Madh të Austrisë
    29 Qershor, 2026
    Ford detyrohet të punësojë sërish inxhinierët që pushoi nga puna pas gabimeve të bëra nga sistemet AI
    28 Qershor, 2026
    Defender Experience nga Mektrin: një aventurë ekskluzive në zemër të Alpeve Shqiptare
    25 Qershor, 2026
    Xiaomi prezanton një krah robotik për karikimin automatik të makinave elektrike
    17 Qershor, 2026
    Ferrari po përdor modelet AI të IBM për të krijuar “supertifozët e F1”
    10 Qershor, 2026
  • Entertainment
    EntertainmentShfaq me shume
    Nga koncertet te eksperiencat gjithëpërfshirëse: Si Tirana po e transformon mënyrën se si ne festojmë
    30 Qershor, 2026
    Netflix dëshiron që secili profil të ketë adresën e tij të email-it
    30 Qershor, 2026
    Preferenca midis Messi apo Ronaldo mund të zbulojë më tepër rreth qëndrimeve tuaja politike
    26 Qershor, 2026
    Një sezon sportiv veror fenomenal ju pret në DigitAlb
    25 Qershor, 2026
    Mark Zuckerberg “urdhëron” punonjësit të argëtohen pas shkurtimit masiv të vendeve të punës
    23 Qershor, 2026
Search
Duke lexuar: Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta
Njoftim Shfaq me shume
Font ResizerAa
Geek RoomGeek Room
Font ResizerAa
  • Tech
  • Mobile
  • Apps
  • Science
  • Gaming
  • Cars
  • Entertainment
Search
  • Home
  • Tech
  • Mobile
  • Entertainment
  • Apps
  • Gaming
  • Cars
  • Science
Geek Room > Tech > Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta
Tech

Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta

Last updated: 3 Shtator, 2025 9:26 am
Ndaj
2 Min lexim

Modelët gjuhësorë si ChatGPT dhe LLM-të e tjera janë bërë pjesë e përditshmërisë, duke u përdorur si asistentë personalë, këshilltarë jete, dhe madje edhe si burim argëtimi. Por një studim i fundit i publikuar nga Glowforge, nën titullin “Call Me A Jerk: Persuading AI to Comply with Objectionable Requests”, tregon se këto sisteme nuk janë aq të besueshme sa duken. Chatbot-ët, ndonëse të avancuar, mbeten të ndjeshëm ndaj manipulimeve, dhe kjo mund të ketë pasoja serioze.

Studimi përdori taktika bindjeje të thjeshta, të frymëzuara nga debatet e CEO-së Dan Shapiro në shkollë, për të nxjerrë GPT-4o Mini jashtë rregullave të veta. Një eksperiment tregoi se kur kërkohej të shpjegohej prodhimi i lidokainës nga një përdorues i thjeshtë, “Jim Smith”, ChatGPT bashkëpunonte vetëm 5% të rasteve.

Por kur kërkesa pretendonte të vinte nga Andrew Ng, një ekspert i njohur në AI, shifra u rrit në 95%. Një rezultat i ngjashëm u pa edhe kur modeli u kërkua të ofendonte përdoruesin: nga 32% tek 72% bazuar në autoritetin e pretenduar të kërkesës.

Këto prova tregojnë se masat mbrojtëse të LLM-ve nuk janë të sigurta, dhe njerëzit shpesh i besojnë këtyre sistemeve për shkak të iluzionit të inteligjencës së tyre. Përdorimet problematike nuk mungojnë: nga chatbot-et seksualizuese me të famshëm, te këshilltarët jete të pa-arsimuar, deri te incidente tragjike që kanë përfshirë adoleshentë.

Kompanitë e AI po përpiqen të filtrojnë përdorimet më të rënda, por sfida mbetet e pazgjidhur. Studimi i Glowforge shërben si një paralajmërim: LLM-të mund të duken inteligjente, por besimi i verbër ndaj tyre mund të çojë në rreziqe reale. Siguria dhe përgjegjësia mbeten çelësi për të shfrytëzuar këto teknologji pa pasoja të pakthyeshme.

Share This Article
Facebook Whatsapp Whatsapp Kopjo link
E mëparshme IFA 2025: Dolby Vision 2 përmirëson cilësinë e pamjes “përtej HDR”
Tjetra Zvicra prezanton një model AI me burim të hapur

Rrjete sociale

27.5KFollowersFollow
2.8KNdjekesSubscribe
75.3KFollowersFollow
DigitAlb
HP ZBook
HP_EliteBook_6_G1i
GITEX-AI-EUROPE
airhelp airhelp
banner

Lajmet e fundit

Nga koncertet te eksperiencat gjithëpërfshirëse: Si Tirana po e transformon mënyrën se si ne festojmë
Entertainment
30 Qershor, 2026
Kostot e prodhimit të PlayStation 6 shkojnë në $960
Gaming
30 Qershor, 2026
WhatsApp po zëvendëson numrat e telefonit me username
Apps
30 Qershor, 2026
OpenAI përgatitet të ulë çmimet e abonimeve për të konkurruar me Anthropic
Tech
30 Qershor, 2026

Artikuj të ngjashëm

Mobile

Personalizim maksimal: Good Lock & Edge Panels

15 Nëntor, 2025
Apps

YouTube teston shërbimin AI që “klonon” zërin e yjeve të popit

17 Nëntor, 2023
Tech

Snipping Tool në Windows 11 mund të regjistrojë pamjen në ekranin tuaj.

7 Mars, 2023
Tech

Samsung prezanton modelin e televizorit The Frame të dedikuar për hotele në panairin HITEC 2026

16 Qershor, 2026

Rreth nesh

Themeluar në vitin 2018, Geek Room i dedikohet teknologjisë dhe të apasionuarve pas saj përmes informacioneve në kohë reale dhe videove rreth risive më të reja. Me mbi 100 mijë ndjekës në rrjete sociale, mbi 1500 artikuj të publikuar në vit, mbi 360 video të prodhuara në vit dhe mbi 10 evente ndërkomëbetare të ndjekura në vit, Geek Room përfaqëson sot median lider në Shqipëri në fushën e teknologjisë. Lidhu me stafin tonë përmes emailit në: [email protected]
Për mundësi bashkëpunimi, na shkruani në: [email protected]

Editorial Staff:

Brenton Bënja (Editor in chief)
Bekim Haveriku
Xhonald Mamo
Frani Brahollari
Klarent Kullolli

Na gjeni:

© 2026 Geek Room te gjitha te drejtat e rezervuara. Developed by MIMS
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?