Duke përdorur këtë faqe, ju pranoni politikat e privatësisë
Accept
Geek RoomGeek RoomGeek Room
  • Home
  • Tech
    TechShfaq me shume
    Përjetoni fuqi të jashtëzakonshme dhe pastrim inteligjent
    11 Tetor, 2025
    Ekosistemi i Samsung që përshtatet me ritmin e jetës modern
    10 Tetor, 2025
    Tag Heuer prezanton një orë inteligjente në bashkëpunim me New Balance
    9 Tetor, 2025
    Studimi zbulon se panelet diellore vazhdojnë të jenë funksionalë dhe pas 30 vitesh punë
    9 Tetor, 2025
    Startup-i hapësinor dëshiron të dorëzojë porositë kudo në botë brenda 1 ore
    9 Tetor, 2025
  • Mobile
    MobileShfaq me shume
    Smartphone-i juaj i ardhshëm mund të mos përfshijë as kabllon e karikimit në kuti
    7 Tetor, 2025
    Moto X70 Air me një dizajn super të hollë pritet të prezantohet gjatë fundit të muajit tetor
    30 Shtator, 2025
    Xiaomi prezanton serinë 17 të smartphone-ve në Kinë
    26 Shtator, 2025
    Apple adreson problemin e gërvishtjeve në serinë iPhone 17
    26 Shtator, 2025
    9 shërbime të reja që do të vijnë në smartphone-t Galaxy me One UI 8.5
    24 Shtator, 2025
  • Apps
    AppsShfaq me shume
    Familjet italiane padisin Instagram, Facebook dhe TikTok mbi sigurinë e fëmijëve
    9 Tetor, 2025
    WhatsApp mundëson përkthimin e mesazheve në 21 gjuhë të ndryshme
    9 Tetor, 2025
    Videoja ku drejtuesi i Instagram premton se “nuk po ju përgjojmë” shkakton polemika
    4 Tetor, 2025
    Snapchat kufizon hapësirën ruajtëse në cloud, prezanton planet e reja të abonimit për më tepër hapësirë
    30 Shtator, 2025
    Trump tregon se SHBA po arrijnë marrëveshjen me TikTok, kompania kineze do të sigurojë 1 nga 7 vende në bordin drejtues
    23 Shtator, 2025
  • Science
    ScienceShfaq me shume
    Çmimi Nobel në Mjekësi shkon për 3 shkencëtarët që bënë zbulime të rëndësishme rreth sistemit imunitar
    8 Tetor, 2025
    Çmimi Nobel në fizikë ndahet midis 3 personave për punën e tyre në mekanikën kuantike
    8 Tetor, 2025
    Bateria e re prej betoni ofron 10 herë më tepër energji se bateritë e zakonshme
    5 Tetor, 2025
    AI krijon gjenomën e viruseve që mund të shkatërrojnë bakteret
    4 Tetor, 2025
    DARPA arrin të transmetojë energji pa tela në një distancë prej 8.6 km
    4 Tetor, 2025
  • Gaming
    GamingShfaq me shume
    Zbulohet lista e lojërave të nominuara në Yugo Game Awards 2025, me SCUM, Blacksmith Master dhe The King si më të nominuarit
    7 Tetor, 2025
    Microsoft do të prezantojë një plan falas me reklama të Xbox Cloud Gaming
    5 Tetor, 2025
    Lojtari i Minecraft krijon një version funksional të ChatGPT brenda lojës
    1 Tetor, 2025
    Sony feston 30 vjetorin e PlayStation me një libër fotografish që kushton deri në $325
    30 Shtator, 2025
    Prezantohet zyrtarisht arritja e marrëveshjes mes EA dhe Silver Lake, PIF, Affinity Partners për $55 miliardë
    30 Shtator, 2025
  • Cars
    CarsShfaq me shume
    CEO i Xiaomi tregon se kompania “zbërtheu” çdo pjesë të 3 Tesla Model Y për t’i studiuar në detaje
    27 Shtator, 2025
    A shkaktojnë makinat elektrike të përziera dhe si mund të zgjidhet ky problem
    14 Shtator, 2025
    IAA Mobility 2025: Polestar 5 është gati të sfidojë Porsche
    9 Shtator, 2025
    IAA Mobility 2025: Audi prezanton modelin e ri Q3 dhe “Concept C”
    9 Shtator, 2025
    IAA Mobility 2025: Mercedes-Benz prezanton një model të ri GLC tërësisht elektrik
    9 Shtator, 2025
  • Entertainment
    EntertainmentShfaq me shume
    Salone del Mobile Milano sjell vizionin e tij në Riad me “Red in Progress”
    9 Tetor, 2025
    Plotësoni këtë pyetësor për të mësuar se cila racë e qenve i përshtatet stilit tuaj
    8 Tetor, 2025
    Energjia e gjeneruar nga burimet e rinovueshme tejkalon atë të gjeneruar nga termocentralet
    8 Tetor, 2025
    Sonic The Hedgehog do të jetë ambasador zyrtar i Lojërave Olimpike
    7 Tetor, 2025
    Seletti: Nga llampat në formë bananesh tek bashkëpunimet artistike që riformësuan dizajnin bashkëkohor
    3 Tetor, 2025
Search
Duke lexuar: Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta
Njoftim Shfaq me shume
Font ResizerAa
Geek RoomGeek Room
Font ResizerAa
  • Tech
  • Mobile
  • Apps
  • Science
  • Gaming
  • Cars
  • Entertainment
Search
  • Home
  • Tech
  • Mobile
  • Entertainment
  • Apps
  • Gaming
  • Cars
  • Science
Geek Room > Tech > Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta
Tech

Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta

Last updated: 3 Shtator, 2025 9:26 am
Ndaj
2 Min lexim

Modelët gjuhësorë si ChatGPT dhe LLM-të e tjera janë bërë pjesë e përditshmërisë, duke u përdorur si asistentë personalë, këshilltarë jete, dhe madje edhe si burim argëtimi. Por një studim i fundit i publikuar nga Glowforge, nën titullin “Call Me A Jerk: Persuading AI to Comply with Objectionable Requests”, tregon se këto sisteme nuk janë aq të besueshme sa duken. Chatbot-ët, ndonëse të avancuar, mbeten të ndjeshëm ndaj manipulimeve, dhe kjo mund të ketë pasoja serioze.

Studimi përdori taktika bindjeje të thjeshta, të frymëzuara nga debatet e CEO-së Dan Shapiro në shkollë, për të nxjerrë GPT-4o Mini jashtë rregullave të veta. Një eksperiment tregoi se kur kërkohej të shpjegohej prodhimi i lidokainës nga një përdorues i thjeshtë, “Jim Smith”, ChatGPT bashkëpunonte vetëm 5% të rasteve.

Por kur kërkesa pretendonte të vinte nga Andrew Ng, një ekspert i njohur në AI, shifra u rrit në 95%. Një rezultat i ngjashëm u pa edhe kur modeli u kërkua të ofendonte përdoruesin: nga 32% tek 72% bazuar në autoritetin e pretenduar të kërkesës.

Këto prova tregojnë se masat mbrojtëse të LLM-ve nuk janë të sigurta, dhe njerëzit shpesh i besojnë këtyre sistemeve për shkak të iluzionit të inteligjencës së tyre. Përdorimet problematike nuk mungojnë: nga chatbot-et seksualizuese me të famshëm, te këshilltarët jete të pa-arsimuar, deri te incidente tragjike që kanë përfshirë adoleshentë.

Kompanitë e AI po përpiqen të filtrojnë përdorimet më të rënda, por sfida mbetet e pazgjidhur. Studimi i Glowforge shërben si një paralajmërim: LLM-të mund të duken inteligjente, por besimi i verbër ndaj tyre mund të çojë në rreziqe reale. Siguria dhe përgjegjësia mbeten çelësi për të shfrytëzuar këto teknologji pa pasoja të pakthyeshme.

Share This Article
Facebook Whatsapp Whatsapp Kopjo link
E mëparshme IFA 2025: Dolby Vision 2 përmirëson cilësinë e pamjes “përtej HDR”
Tjetra Zvicra prezanton një model AI me burim të hapur

Rrjete sociale

27.5kFollowersFollow
2.8kNdjekesSubscribe
75.3kFollowersFollow
Happy App
airhelp airhelp
Allweb
banner

Lajmet e fundit

Përjetoni fuqi të jashtëzakonshme dhe pastrim inteligjent
Tech
11 Tetor, 2025
Ekosistemi i Samsung që përshtatet me ritmin e jetës modern
Tech
10 Tetor, 2025
Familjet italiane padisin Instagram, Facebook dhe TikTok mbi sigurinë e fëmijëve
Apps
9 Tetor, 2025
Tag Heuer prezanton një orë inteligjente në bashkëpunim me New Balance
Tech
9 Tetor, 2025

Artikuj të ngjashëm

Tech

Përgatituni për edicionin e tretë të JunctionX Tirana në datat 2 – 4 maj

17 Prill, 2025
Tech

Apple vendos për konferencën e zhvilluesve WWDC 2020

14 Mars, 2020
Tech

Hoteli i parë hapësinor nis ndërtimin dhe do të përfundojë në 2025

4 Mars, 2021
Tech

Samsung prezanton Freestyle, një projektor për t’u argëtuar kudo që të jeni

6 Janar, 2022

Rreth nesh

Themeluar në vitin 2018, Geek Room i dedikohet teknologjisë dhe të apasionuarve pas saj përmes informacioneve në kohë reale dhe videove rreth risive më të reja. Me mbi 100 mijë ndjekës në rrjete sociale, mbi 1500 artikuj të publikuar në vit, mbi 360 video të prodhuara në vit dhe mbi 10 evente ndërkomëbetare të ndjekura në vit, Geek Room përfaqëson sot median lider në Shqipëri në fushën e teknologjisë. Lidhu me stafin tonë përmes emailit në: info@geekroom.al
Për mundësi bashkëpunimi, na shkruani në: marketing@geekroom.al

Editorial Staff:

Brenton Bënja (Editor in chief)
Bekim Haveriku
Xhonald Mamo
Franci Brahollari

Na gjeni:

© 2025 Geek Room te gjitha te drejtat e rezervuara. Developed by MIMS
adbanner
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?