Duke përdorur këtë faqe, ju pranoni politikat e privatësisë
Accept
Geek RoomGeek RoomGeek Room
  • Home
  • Tech
    TechShfaq me shume
    Galaxy Buds 4 do të vijnë me një dizajn të rid he një shërbim që ju ndihmon të gjeni smartphone-in tuaj
    21 Nëntor, 2025
    Google prezanton modelin më të ri gjenerues të imazheve, Nano Banana Pro
    21 Nëntor, 2025
    Si ta përmirësoni pastrimin dhe efikasitetin energjetik të pianurës
    20 Nëntor, 2025
    Albania Future Now: ekosistemi i inovacionit shqiptar, prezantohet në një tjetër arenë ndërkombëtare.
    20 Nëntor, 2025
    Tashmë monitorimi i shëndetit mund të arrihet dhe nga vathët inteligjentë
    19 Nëntor, 2025
  • Mobile
    MobileShfaq me shume
    Apple mund të prezantojë së shpejti kasa mbrojtëse të ndjeshme ndaj prekjes për iPhone
    19 Nëntor, 2025
    Apple mund të lejojë më në fund përdoruesit të zëvendësojnë Siri me një asistent tjetër zanor
    18 Nëntor, 2025
    Personalizim maksimal: Good Lock & Edge Panels
    15 Nëntor, 2025
    iPhone 18 Pro Max mund të jetë iPhone më i rëndë i prodhuar ndonjëherë
    13 Nëntor, 2025
    Apple prezanton mënyrën e re të mbajtjes së një iPhone
    12 Nëntor, 2025
  • Apps
    AppsShfaq me shume
    YouTube po teston rikthimin e DM në platformë
    20 Nëntor, 2025
    WhatsApp teston mbështetjen e disa llogarive në versionin më të fundit beta për iPhone
    20 Nëntor, 2025
    Google Play prezanton aplikacionet më të mira për vitin 2025
    19 Nëntor, 2025
    Një e metë e thjeshtë në sigurinë e WhatsApp ekspozoi 3.5 miliardë numra telefoni të përdoruesve
    19 Nëntor, 2025
    WhatsApp do të nisë integrimin e bisedave nga palët e treta në Evropë
    15 Nëntor, 2025
  • Science
    ScienceShfaq me shume
    Lentet e reja që imitojnë sytë e njerëzve i mundësojnë robotëve një pamje më të qartë
    18 Nëntor, 2025
    Sam Altman po punon për të modifikuar gjenetikisht fëmijët që të mos mbartin sëmundje të trashëgueshme
    17 Nëntor, 2025
    Të folurit e disa gjuhëve të ndryshme mund të ngadalësojë plakjen biologjike
    14 Nëntor, 2025
    Teleskopi James Webb mund të ketë zbuluar gjeneratën e parë të yjeve në univers
    13 Nëntor, 2025
    Studiuesit në MIT po zhvillojnë një çip të injektueshëm për të luftuar çrregullimet mendore
    11 Nëntor, 2025
  • Gaming
    GamingShfaq me shume
    The Game Awards prezanton video-lojërat e nominuara për vitin 2025
    18 Nëntor, 2025
    Red Dead Redmption vjen në PS5, Xbox, iOS dhe Android
    15 Nëntor, 2025
    Sony prezantoi një monitor për PlayStation me shpejtësi rifreskimi 240Hz dhe karikues për levën DualSense
    12 Nëntor, 2025
    Një burrë nga Hungaria kërcen për 144 orë për të thyer rekordin në botën e video-lojrave
    12 Nëntor, 2025
    Publikimi i GTA 6 shtyhet deri në nëntor 2026
    7 Nëntor, 2025
  • Cars
    CarsShfaq me shume
    Gemini AI do të jetë qendra e re e partneritetit mes McLaren dhe Google
    20 Nëntor, 2025
    Porsche prezanton zyrtarisht modelin e saj më të fuqishëm, SUV Cayenne tërësisht elektrik
    20 Nëntor, 2025
    Nissan po riimagjinon zhvillimin e makinave nëpërmjet AI
    17 Nëntor, 2025
    Porsche sjell kartën e kreditit Premium për klientët e saj
    17 Nëntor, 2025
    Ekspertët zbulojnë temperaturën ideale për ngrohjen e makinës në dimër
    4 Nëntor, 2025
  • Entertainment
    EntertainmentShfaq me shume
    Lojtarët më të mirë shqiptarë të Tetris-it garojnë për titullin kombëtar
    19 Nëntor, 2025
    Nivelet më të larta të CO2 po rrisin kaloritë në ushqim dhe ulin vlerat e tyre ushqyese
    18 Nëntor, 2025
    Kjo foto e mrekullueshme e parashutistit me Diellin në sfond bën xhiron e internetit
    15 Nëntor, 2025
    Piramida e Tiranës vlerësohet nga Architectural Record Awards në kategorinë “Adaptive Reuse”
    15 Nëntor, 2025
    Sa herë që ju prisni të motivoheni, truri e bën stërvitjen e radhës 35% më të vështirë
    14 Nëntor, 2025
Search
Duke lexuar: Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta
Njoftim Shfaq me shume
Font ResizerAa
Geek RoomGeek Room
Font ResizerAa
  • Tech
  • Mobile
  • Apps
  • Science
  • Gaming
  • Cars
  • Entertainment
Search
  • Home
  • Tech
  • Mobile
  • Entertainment
  • Apps
  • Gaming
  • Cars
  • Science
Geek Room > Tech > Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta
Tech

Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta

Last updated: 3 Shtator, 2025 9:26 am
Ndaj
2 Min lexim

Modelët gjuhësorë si ChatGPT dhe LLM-të e tjera janë bërë pjesë e përditshmërisë, duke u përdorur si asistentë personalë, këshilltarë jete, dhe madje edhe si burim argëtimi. Por një studim i fundit i publikuar nga Glowforge, nën titullin “Call Me A Jerk: Persuading AI to Comply with Objectionable Requests”, tregon se këto sisteme nuk janë aq të besueshme sa duken. Chatbot-ët, ndonëse të avancuar, mbeten të ndjeshëm ndaj manipulimeve, dhe kjo mund të ketë pasoja serioze.

Studimi përdori taktika bindjeje të thjeshta, të frymëzuara nga debatet e CEO-së Dan Shapiro në shkollë, për të nxjerrë GPT-4o Mini jashtë rregullave të veta. Një eksperiment tregoi se kur kërkohej të shpjegohej prodhimi i lidokainës nga një përdorues i thjeshtë, “Jim Smith”, ChatGPT bashkëpunonte vetëm 5% të rasteve.

Por kur kërkesa pretendonte të vinte nga Andrew Ng, një ekspert i njohur në AI, shifra u rrit në 95%. Një rezultat i ngjashëm u pa edhe kur modeli u kërkua të ofendonte përdoruesin: nga 32% tek 72% bazuar në autoritetin e pretenduar të kërkesës.

Këto prova tregojnë se masat mbrojtëse të LLM-ve nuk janë të sigurta, dhe njerëzit shpesh i besojnë këtyre sistemeve për shkak të iluzionit të inteligjencës së tyre. Përdorimet problematike nuk mungojnë: nga chatbot-et seksualizuese me të famshëm, te këshilltarët jete të pa-arsimuar, deri te incidente tragjike që kanë përfshirë adoleshentë.

Kompanitë e AI po përpiqen të filtrojnë përdorimet më të rënda, por sfida mbetet e pazgjidhur. Studimi i Glowforge shërben si një paralajmërim: LLM-të mund të duken inteligjente, por besimi i verbër ndaj tyre mund të çojë në rreziqe reale. Siguria dhe përgjegjësia mbeten çelësi për të shfrytëzuar këto teknologji pa pasoja të pakthyeshme.

Share This Article
Facebook Whatsapp Whatsapp Kopjo link
E mëparshme IFA 2025: Dolby Vision 2 përmirëson cilësinë e pamjes “përtej HDR”
Tjetra Zvicra prezanton një model AI me burim të hapur

Rrjete sociale

27.5kFollowersFollow
2.8kNdjekesSubscribe
75.3kFollowersFollow
Happy App
airhelp airhelp
banner

Lajmet e fundit

Galaxy Buds 4 do të vijnë me një dizajn të rid he një shërbim që ju ndihmon të gjeni smartphone-in tuaj
Tech
21 Nëntor, 2025
Google Pixel 10 arrin të shpërndajë foto me përdoruesit e iPhone përmes AirDrop
Uncategorized
21 Nëntor, 2025
Google prezanton modelin më të ri gjenerues të imazheve, Nano Banana Pro
Tech
21 Nëntor, 2025
Si ta përmirësoni pastrimin dhe efikasitetin energjetik të pianurës
Tech
20 Nëntor, 2025

Artikuj të ngjashëm

Tech

Kina dëshiron të limitojë përdorimin e smartphone-ve nga fëmijët dhe adoleshentët në vetëm 1 orë në ditë

5 Gusht, 2023
Tech

Google prezanton Bard AI i cili do të rivalizojë ChatGPT

7 Shkurt, 2023
Tech

Alienët mund të jenë duke përdorur “komunikimin kuantik” për të dërguar mesazhe në hapësirë

9 Korrik, 2022
Tech

Ky prodhues i smartphone-ve mundi Samsung dhe Apple në Meksikë

27 Shtator, 2022

Rreth nesh

Themeluar në vitin 2018, Geek Room i dedikohet teknologjisë dhe të apasionuarve pas saj përmes informacioneve në kohë reale dhe videove rreth risive më të reja. Me mbi 100 mijë ndjekës në rrjete sociale, mbi 1500 artikuj të publikuar në vit, mbi 360 video të prodhuara në vit dhe mbi 10 evente ndërkomëbetare të ndjekura në vit, Geek Room përfaqëson sot median lider në Shqipëri në fushën e teknologjisë. Lidhu me stafin tonë përmes emailit në: [email protected]
Për mundësi bashkëpunimi, na shkruani në: [email protected]

Editorial Staff:

Brenton Bënja (Editor in chief)
Bekim Haveriku
Xhonald Mamo
Franci Brahollari

Na gjeni:

© 2025 Geek Room te gjitha te drejtat e rezervuara. Developed by MIMS
adbanner
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?