Duke përdorur këtë faqe, ju pranoni politikat e privatësisë
Accept
Geek RoomGeek RoomGeek Room
  • Home
  • Tech
    TechShfaq me shume
    Kina krijon një rrjet AI të shtrirë përgjatë 55,000 km që funksionon si një superkompjuter masiv
    12 Dhjetor, 2025
    Google prezanton “Disco”, mjetin e ri AI që shndërron tabelat e browser në aplikacione
    12 Dhjetor, 2025
    CEO i kompanisë kineze të robotëve humanoid lejon robotin ta shkelmojë për të bindur publikun
    11 Dhjetor, 2025
    ChatGPT përdor aplikacionet e Adobe për të edituar fotot dhe PDF tuaja falas
    11 Dhjetor, 2025
    Hakerët manipulojnë ChatGPT, Grok dhe Google për të ndihmuar në shpërndarjen e malware
    11 Dhjetor, 2025
  • Mobile
    MobileShfaq me shume
    Honor do të nisë prodhimin në masë të Robot Phone në gjysmën e parë të 2026
    9 Dhjetor, 2025
    Google dhe Apple bashkëpunojnë për ta bërë procesin e kalimit ndërmjet Android-iPhone sa më të lehtë
    9 Dhjetor, 2025
    Justin Bieber përfaqëson shumë përdorues të iPhone me ankesën rreth dizajnit të shërbimit të diktimit
    8 Dhjetor, 2025
    Njihuni me smartphone-in më të ri të palosshëm Samsung Galaxy Z TriFold
    2 Dhjetor, 2025
    Poco prezanton smartphone-in flagship me material “xhins” në pjesën e pasme
    28 Nëntor, 2025
  • Apps
    AppsShfaq me shume
    Miliona fëmijë dhe adoleshentë humbin aksesin në llogaritë e tyre të rrjeteve sociale pas ndalimit nga qeveria australiane
    10 Dhjetor, 2025
    Facebook ridizenjohet për t’u dukur më i ngjashëm me Instagram
    10 Dhjetor, 2025
    Elon Musk ndalon Komisionin Evropian të bëjë reklama në X pas gjobës €120 milionë
    10 Dhjetor, 2025
    Apple prezanton aplikacionet më të mira në App Store për vitin 2025
    9 Dhjetor, 2025
    YouTube prezanton një version të ngjashëm me Spotify Wrapped për video
    4 Dhjetor, 2025
  • Science
    ScienceShfaq me shume
    Disa kërpudha në Çernobil po pësojnë mutacione që i lejojnë të ushqehen nga radioaktiviteti
    5 Dhjetor, 2025
    Shkencëtarët krijojnë materialin tekstil më të errët në botë, që përthith 99.87% të dritës
    5 Dhjetor, 2025
    Mbetjet e kafesë të transformuara në beton ulin emëtimet e karbonit me 26%
    29 Nëntor, 2025
    Studimi arrin në përfundimin se shikimi i videove të shkurtra lidhet me një shëndet mendor të përkeqësuar
    27 Nëntor, 2025
    Shkencëtarët krijojnë një motor kërkimi për kodin gjenetik, si një “Google për ADN”
    24 Nëntor, 2025
  • Gaming
    GamingShfaq me shume
    Nintendo përgatitet për blerjen e Bandai Namco Studio
    28 Nëntor, 2025
    Ubisoft prezanton një lojë të re të fuqizuar nga AI gjenerative
    25 Nëntor, 2025
    The Game Awards prezanton video-lojërat e nominuara për vitin 2025
    18 Nëntor, 2025
    Red Dead Redmption vjen në PS5, Xbox, iOS dhe Android
    15 Nëntor, 2025
    Sony prezantoi një monitor për PlayStation me shpejtësi rifreskimi 240Hz dhe karikues për levën DualSense
    12 Nëntor, 2025
  • Cars
    CarsShfaq me shume
    Kia prezanton vizionin e së ardhmes me “konceptin e artë”
    6 Dhjetor, 2025
    Volvo XC40: Makina perfekte për familjen tuaj, tani vjen me një seggiolino falas!
    5 Dhjetor, 2025
    Norvegjia vendos një rekord të ri në përdorimin e makinave elektrike, përbëjnë pothuajse 100% të regjistrimeve në nëntor
    4 Dhjetor, 2025
    Njihuni me SUV-in më të ri hibrid Lynk & Co 08
    28 Nëntor, 2025
    Gemini AI do të jetë qendra e re e partneritetit mes McLaren dhe Google
    20 Nëntor, 2025
  • Entertainment
    EntertainmentShfaq me shume
    Në qytetin e Bernës ju mund të notoni për të shkuar në punë ose shtëpi
    12 Dhjetor, 2025
    Studimi tregon se lëngu i portokallit ndikon pozitivisht në mijëra gjene të qelizave imune
    5 Dhjetor, 2025
    Ajri i ndotur “mund të çojë dëm” stërvitjen në palestër
    5 Dhjetor, 2025
    Studimi tregon se fëmijët me prindër striktë kanë më tepër shance të zhvillojnë shenja të depresionit
    5 Dhjetor, 2025
    14-vjecari fiton çmimin pas krijimit të origamit që mund të mbajë një peshë 10,000 herë më të madhe se pesha e saj
    4 Dhjetor, 2025
Search
Duke lexuar: Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta
Njoftim Shfaq me shume
Font ResizerAa
Geek RoomGeek Room
Font ResizerAa
  • Tech
  • Mobile
  • Apps
  • Science
  • Gaming
  • Cars
  • Entertainment
Search
  • Home
  • Tech
  • Mobile
  • Entertainment
  • Apps
  • Gaming
  • Cars
  • Science
Geek Room > Tech > Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta
Tech

Chatbot-ët e AI mund të manipulohen për të thyer rregullat e tyre përmes taktikave të thjeshta

Last updated: 3 Shtator, 2025 9:26 am
Ndaj
2 Min lexim

Modelët gjuhësorë si ChatGPT dhe LLM-të e tjera janë bërë pjesë e përditshmërisë, duke u përdorur si asistentë personalë, këshilltarë jete, dhe madje edhe si burim argëtimi. Por një studim i fundit i publikuar nga Glowforge, nën titullin “Call Me A Jerk: Persuading AI to Comply with Objectionable Requests”, tregon se këto sisteme nuk janë aq të besueshme sa duken. Chatbot-ët, ndonëse të avancuar, mbeten të ndjeshëm ndaj manipulimeve, dhe kjo mund të ketë pasoja serioze.

Studimi përdori taktika bindjeje të thjeshta, të frymëzuara nga debatet e CEO-së Dan Shapiro në shkollë, për të nxjerrë GPT-4o Mini jashtë rregullave të veta. Një eksperiment tregoi se kur kërkohej të shpjegohej prodhimi i lidokainës nga një përdorues i thjeshtë, “Jim Smith”, ChatGPT bashkëpunonte vetëm 5% të rasteve.

Por kur kërkesa pretendonte të vinte nga Andrew Ng, një ekspert i njohur në AI, shifra u rrit në 95%. Një rezultat i ngjashëm u pa edhe kur modeli u kërkua të ofendonte përdoruesin: nga 32% tek 72% bazuar në autoritetin e pretenduar të kërkesës.

Këto prova tregojnë se masat mbrojtëse të LLM-ve nuk janë të sigurta, dhe njerëzit shpesh i besojnë këtyre sistemeve për shkak të iluzionit të inteligjencës së tyre. Përdorimet problematike nuk mungojnë: nga chatbot-et seksualizuese me të famshëm, te këshilltarët jete të pa-arsimuar, deri te incidente tragjike që kanë përfshirë adoleshentë.

Kompanitë e AI po përpiqen të filtrojnë përdorimet më të rënda, por sfida mbetet e pazgjidhur. Studimi i Glowforge shërben si një paralajmërim: LLM-të mund të duken inteligjente, por besimi i verbër ndaj tyre mund të çojë në rreziqe reale. Siguria dhe përgjegjësia mbeten çelësi për të shfrytëzuar këto teknologji pa pasoja të pakthyeshme.

Share This Article
Facebook Whatsapp Whatsapp Kopjo link
E mëparshme IFA 2025: Dolby Vision 2 përmirëson cilësinë e pamjes “përtej HDR”
Tjetra Zvicra prezanton një model AI me burim të hapur

Rrjete sociale

27.5kFollowersFollow
2.8kNdjekesSubscribe
75.3kFollowersFollow
jaguar
airhelp airhelp
banner

Lajmet e fundit

Kina krijon një rrjet AI të shtrirë përgjatë 55,000 km që funksionon si një superkompjuter masiv
Tech
12 Dhjetor, 2025
Në qytetin e Bernës ju mund të notoni për të shkuar në punë ose shtëpi
Entertainment
12 Dhjetor, 2025
Google prezanton “Disco”, mjetin e ri AI që shndërron tabelat e browser në aplikacione
Tech
12 Dhjetor, 2025
CEO i kompanisë kineze të robotëve humanoid lejon robotin ta shkelmojë për të bindur publikun
Tech
11 Dhjetor, 2025

Artikuj të ngjashëm

Tech

Mira Murati, CTO në Open AI, tregon se AI mund të keqpërdoret dhe këshillon vendosjen e rregullave të reja kontrolluese

7 Shkurt, 2023
Tech

Këtë 8 Mars, ju ftojmë të merrni pjesë në Women in Data Science

7 Mars, 2021
Tech

Apple synon vitin 2024 për pajisjen e parë me palosje dhe nuk është një iPhone

23 Tetor, 2022
Tech

Mekanizmi AI zbulon dezinformimin me një saktësi 96%, madje mund të gjejë dhe burimin e tij

30 Maj, 2021

Rreth nesh

Themeluar në vitin 2018, Geek Room i dedikohet teknologjisë dhe të apasionuarve pas saj përmes informacioneve në kohë reale dhe videove rreth risive më të reja. Me mbi 100 mijë ndjekës në rrjete sociale, mbi 1500 artikuj të publikuar në vit, mbi 360 video të prodhuara në vit dhe mbi 10 evente ndërkomëbetare të ndjekura në vit, Geek Room përfaqëson sot median lider në Shqipëri në fushën e teknologjisë. Lidhu me stafin tonë përmes emailit në: info@geekroom.al
Për mundësi bashkëpunimi, na shkruani në: marketing@geekroom.al

Editorial Staff:

Brenton Bënja (Editor in chief)
Bekim Haveriku
Xhonald Mamo
Franci Brahollari

Na gjeni:

© 2025 Geek Room te gjitha te drejtat e rezervuara. Developed by MIMS
adbanner
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?