Duke përdorur këtë faqe, ju pranoni politikat e privatësisë
Accept
Geek RoomGeek RoomGeek Room
  • Home
  • Tech
    TechShfaq me shume
    Andreas Wil Gerdes & Lumjana Shehu sjellin frymën e re të nomadizmit digjital në AllWeb Tirana!
    31 Tetor, 2025
    Google Labs sjell Pomelli, shërbimin AI që krijon reklama falas për biznesin tuaj
    30 Tetor, 2025
    Barbara Slade Jagodić & Diego Pisa folës në AllWeb, dy perspektiva të ndryshme që takohen tek një ide: njerëzit janë në qendër të transformimit digjital!
    30 Tetor, 2025
    Ripple suporton T-Blocks për tokenizimin e projekteve në Evropën Juglindore
    29 Tetor, 2025
    Si Vodafone Albania e ktheu filozofinë “Pyet një herë” në standard shërbimi 
    Sponsorizuar nga
    vodafone.alvodafone.al
  • Mobile
    MobileShfaq me shume
    Apple Pay vjen në Shqipëri
    29 Tetor, 2025
    Nëse dëshironi të ulni kohën e shpenzuar para telefonit, përdorni këtë kasë mbrojtëse
    28 Tetor, 2025
    OnePlus 15 prezantohet në Kinë me bateri 7,300 mAh dhe shpejtësi rifreskimi 165Hz
    28 Tetor, 2025
    Ja se çfarë duhet të bëni për të ruajtur ngjyrën origjinale të Cosmic Orange iPhone 17 Pro
    25 Tetor, 2025
    Apple ndalon prodhimin e njësive të reja të iPhone Air pas performancës jo të mirë në shitje
    24 Tetor, 2025
  • Apps
    AppsShfaq me shume
    Nuk keni mundësi të udhëtoni? Përdorni këtë aplikacion për të përgatitur fotografi me AI nga “pushimet imagjinare”
    28 Tetor, 2025
    Instagram do të ofrojë shërbimin “Watch History” ku mund të gjeni Reels të fundit që keni parë
    25 Tetor, 2025
    Instagram sjell ikona të veçanta të aplikacionit, por vetëm për adoleshentët
    24 Tetor, 2025
    YouTube po prezanton një shërbim për të ndaluar përhapjen e deepfakes
    22 Tetor, 2025
    Instagram po përditëson ndërfaqjen e përdoruesit
    21 Tetor, 2025
  • Science
    ScienceShfaq me shume
    Studiuesit pretendojnë se kanë mundësuar komunikimin midis 2 personave të cilët po shikonin ëndrra
    19 Tetor, 2025
    Femrat kanë një risk gjenetik më të lartë për zhvillimin e depresionit
    13 Tetor, 2025
    SpotitEarly trajnon qentë dhe AI për të nuhatur format më të shpeshta të kancerit
    11 Tetor, 2025
    Çmimi Nobel në Mjekësi shkon për 3 shkencëtarët që bënë zbulime të rëndësishme rreth sistemit imunitar
    8 Tetor, 2025
    Çmimi Nobel në fizikë ndahet midis 3 personave për punën e tyre në mekanikën kuantike
    8 Tetor, 2025
  • Gaming
    GamingShfaq me shume
    Sony prezanton një version të ri të PS5 Pro lehtësisht të përmirësuar
    22 Tetor, 2025
    Studimi zbulon se mosha mesatare e një “gamer” është 41 vjeç, ndërkohë që 41% e tyre janë femra
    11 Tetor, 2025
    Sony konfirmon se PS6 do të prezantohet brenda “disa vitesh”
    11 Tetor, 2025
    Zbulohet lista e lojërave të nominuara në Yugo Game Awards 2025, me SCUM, Blacksmith Master dhe The King si më të nominuarit
    7 Tetor, 2025
    Microsoft do të prezantojë një plan falas me reklama të Xbox Cloud Gaming
    5 Tetor, 2025
  • Cars
    CarsShfaq me shume
    Kia Sportage 2026 me stilin futurist dhe inteligjencë artificiale, mbërrin në Shqipëri
    28 Tetor, 2025
    Mercedes-Benz prezanton makinën me një bojë super të hollë fotovoltaike
    23 Tetor, 2025
    Rripi i sigurimit multi adaptiv i Volvo vlerësohet si një nga Shpikjet më të Mira të 2025 nga TIME
    21 Tetor, 2025
    Inxhinieri organizon “DDoS-in e parë në botë ndaj makinave autonome”, mbledh 50 makina në një rrugë pa krye
    16 Tetor, 2025
    Ja përse makinat elektrike preferohen më shumë nga meshkujt
    15 Tetor, 2025
  • Entertainment
    EntertainmentShfaq me shume
    NVIDIA nis testimin e GPU të fuqishme në hapësirë duke u përgatitur për të ardhmen e AI
    25 Tetor, 2025
    Netflix, Amazon dhe Apple interesohen për të blerë Warner Bros. Discovery
    24 Tetor, 2025
    Ish-punonjësi i Apple, Sam Sung, ndryshoi emrin e tij për të shmangur vëmendjen e padëshiruar
    24 Tetor, 2025
    NASA konfirmon se Toka do të ketë 2 Hëna deri në 2083
    23 Tetor, 2025
    Kaido Kukk & Anja Nikolovska folës në AllWeb: Kur financat dhe kreativiteti bashkohen për të krijuar inovacion
    23 Tetor, 2025
Search
Duke lexuar: Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta
Njoftim Shfaq me shume
Font ResizerAa
Geek RoomGeek Room
Font ResizerAa
  • Tech
  • Mobile
  • Apps
  • Science
  • Gaming
  • Cars
  • Entertainment
Search
  • Home
  • Tech
  • Mobile
  • Entertainment
  • Apps
  • Gaming
  • Cars
  • Science
Geek Room > Tech > Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta
Tech

Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta

Last updated: 3 Shtator, 2025 9:26 am
Ndaj
2 Min lexim

Modelët gjuhësorë si ChatGPT dhe LLM-të e tjera janë bërë pjesë e përditshmërisë, duke u përdorur si asistentë personalë, këshilltarë jete, dhe madje edhe si burim argëtimi. Por një studim i fundit i publikuar nga Glowforge, nën titullin “Call Me A Jerk: Persuading AI to Comply with Objectionable Requests”, tregon se këto sisteme nuk janë aq të besueshme sa duken. Chatbot-ët, ndonëse të avancuar, mbeten të ndjeshëm ndaj manipulimeve, dhe kjo mund të ketë pasoja serioze.

Studimi përdori taktika bindjeje të thjeshta, të frymëzuara nga debatet e CEO-së Dan Shapiro në shkollë, për të nxjerrë GPT-4o Mini jashtë rregullave të veta. Një eksperiment tregoi se kur kërkohej të shpjegohej prodhimi i lidokainës nga një përdorues i thjeshtë, “Jim Smith”, ChatGPT bashkëpunonte vetëm 5% të rasteve.

Por kur kërkesa pretendonte të vinte nga Andrew Ng, një ekspert i njohur në AI, shifra u rrit në 95%. Një rezultat i ngjashëm u pa edhe kur modeli u kërkua të ofendonte përdoruesin: nga 32% tek 72% bazuar në autoritetin e pretenduar të kërkesës.

Këto prova tregojnë se masat mbrojtëse të LLM-ve nuk janë të sigurta, dhe njerëzit shpesh i besojnë këtyre sistemeve për shkak të iluzionit të inteligjencës së tyre. Përdorimet problematike nuk mungojnë: nga chatbot-et seksualizuese me të famshëm, te këshilltarët jete të pa-arsimuar, deri te incidente tragjike që kanë përfshirë adoleshentë.

Kompanitë e AI po përpiqen të filtrojnë përdorimet më të rënda, por sfida mbetet e pazgjidhur. Studimi i Glowforge shërben si një paralajmërim: LLM-të mund të duken inteligjente, por besimi i verbër ndaj tyre mund të çojë në rreziqe reale. Siguria dhe përgjegjësia mbeten çelësi për të shfrytëzuar këto teknologji pa pasoja të pakthyeshme.

Share This Article
Facebook Whatsapp Whatsapp Kopjo link
E mëparshme IFA 2025: Dolby Vision 2 përmirëson cilësinë e pamjes “përtej HDR”
Tjetra Zvicra prezanton një model AI me burim të hapur

Rrjete sociale

27.5kFollowersFollow
2.8kNdjekesSubscribe
75.3kFollowersFollow
Happy App
airhelp airhelp
Allweb
banner

Lajmet e fundit

Andreas Wil Gerdes & Lumjana Shehu sjellin frymën e re të nomadizmit digjital në AllWeb Tirana!
Tech
31 Tetor, 2025
Google Labs sjell Pomelli, shërbimin AI që krijon reklama falas për biznesin tuaj
Tech
30 Tetor, 2025
Barbara Slade Jagodić & Diego Pisa folës në AllWeb, dy perspektiva të ndryshme që takohen tek një ide: njerëzit janë në qendër të transformimit digjital!
Tech
30 Tetor, 2025
Apple Pay vjen në Shqipëri
Mobile
29 Tetor, 2025

Artikuj të ngjashëm

Tech

Ja cilat janë të përbashkëtat dhe diferencat midis Xiaomi Watch S1 dhe Watch S1 Active

20 Maj, 2022
Tech

Pamjet e bëra leak të Vivo Watch 2 tregojnë formën e rrumbullakët dhe suportin për telefonata

26 Nëntor, 2021
Tech

Modeli i ardhshëm i iPad Pro do të ketë 2 kamera selfie

22 Korrik, 2025
Tech

Shqipëria po përgatitet të pajisë qytetarët me letërnjoftime digjitale

5 Maj, 2024

Rreth nesh

Themeluar në vitin 2018, Geek Room i dedikohet teknologjisë dhe të apasionuarve pas saj përmes informacioneve në kohë reale dhe videove rreth risive më të reja. Me mbi 100 mijë ndjekës në rrjete sociale, mbi 1500 artikuj të publikuar në vit, mbi 360 video të prodhuara në vit dhe mbi 10 evente ndërkomëbetare të ndjekura në vit, Geek Room përfaqëson sot median lider në Shqipëri në fushën e teknologjisë. Lidhu me stafin tonë përmes emailit në: [email protected]
Për mundësi bashkëpunimi, na shkruani në: [email protected]

Editorial Staff:

Brenton Bënja (Editor in chief)
Bekim Haveriku
Xhonald Mamo
Franci Brahollari

Na gjeni:

© 2025 Geek Room te gjitha te drejtat e rezervuara. Developed by MIMS
adbanner
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?