Nga nxitimi i madh për të ndërtuar dhe trajnuar modele gjithnjë e më të mëdha të AI, zhvilluesit kanë përfshirë pjesën më të madhe të informacionit që gjendet në internetin e kërkueshëm për të trajnuar modelet, duke përfshirë me shumë mundësi disa nga të dhënat tuaja publike – dhe potencialisht edhe disa nga të dhënat tuaja private.
Kjo gjë tregon se ne duhet të jemi gjithnjë e më të shqetësuar për sa i përket përdorimit të materialeve të mbrojtura nga e drejta e autorit në trajnimin e modeleve të mëdha të inteligjencës artificiale (AI), prandaj po shikojmë vazhdimisht hapjen e proçeseve ligjore të shumta nga shkrimtarët dhe artistët kundër kompanive të AI. Por nuk janë ato të vetmit persona që duhet të shqetësohen, pasi çdo informacion që gjendet në internet po përdoret nga këto kompani. Për fatin tonë të keq kompanitë si OpenAI nuk tregohen shumë transparentë për sa i përket mënyrës se si i kanë grumbulluar këto informacione, apo se si i ka filtruar veçanërisht informacionet private.
Ka dhe raste të tilla kur informacionet personale dhe të ndjeshme, si imazhet mjekësore, përfunduan në grupe trajnimi të AI, duke ngritur pyetje në lidhje me privatësinë dhe shkeljet e mundshme ligjore.
Një tjetër problem që mendohet se po ndikon për keq në modelet e inteligjencës artificiale është grumbullimi i informacioneve paragjykuese ose i lajmeve të njëanshme, të cilat nuk pasqyrojnë realitetin e situatës.
Shpresojmë që së shpejti rregullatorët të ndërhyjnë dhe të detyrojnë këto kompani të jenë sa më transparente për sa i përket proçesit të grumbullimit të të dhënave nga interneti.