Me adoptimin e shpejtë të AI gjeneruese, po bëhet gjithnjë e më e vështirë të dallosh se cilat përmbajtje janë krijuar nga vetë njerëzit.
Që nga shërbimet si image-to-text apo video-to-text, shërbimet e AI janë në mënyrë të diskutueshme në kulmin e tyre dhe mund të gjenerojnë rezultate të sofistikuara bazuar në kërkesat e përdoruesve. Ka pasur një betejë të vazhdueshme midis botuesve dhe kompanive që qëndrojnë pas këtyre mjeteve të AI për çështje që lidhen me shkeljen e të drejtave të autorit.
Ndërsa CEO i OpenAI Sam Altman pranon se është e pamundur të krijohen mjete si ChatGPT pa përmbajtje me të drejtë autori, ligji për të drejtat e autorit nuk e ndalon përdorimin e përmbajtjes për të trajnuar modelet e AI.
Një studim i ri i publikuar në Nature sugjeron se 57% e përmbajtjes së publikuar në internet është krijuar nga AI. Studiuesit nga Cambridge dhe Oxford pretendojnë se numri në rritje i përmbajtjeve të krijuara nga AI dhe mbështetja e tepërt ndaj mjeteve të AI në të njëjtën përmbajtje mund të çojë vetëm në një rezultat – përgjigje me cilësi të ulët ndaj pyetjeve.
Sipas studimit, përgjigjet e gjeneruara nga AI ndaj pyetjeve kishin vlerë dhe saktësi më të ulët pas çdo përpjekjeje. Sipas Dr. Ilia Shumailov nga Universiteti i Oksfordit: “Është e habitshme se sa shpejt fillon kolapsi i modelit dhe sa i pakapshëm mund të jetë. Në fillim, ajo prek të dhënat e pakicave – të dhëna që përfaqësohen keq. Më pas ndikon në diversitetin e rezultateve dhe varianca zvogëlohet. Ndonjëherë, vëreni një përmirësim të vogël për të dhënat e shumta, që fsheh degradimin e performancës në të dhënat e pakta. Kolapsi i modeleve të AI mund të ketë pasoja të rënda.”
Siç mund ta dini, modelet e AI varen nga informacioni në internet për trajnim. Si i tillë, nëse informacioni në internet është i gjeneruar nga AI dhe i pasaktë, trajnimi i chatbots bëhet i paefektshëm, duke nxitur gjenerimin e përgjigjeve të gabuara dhe dezinformatave.