Meta ka përdorur postimet publike në Facebook dhe Instagram për të trajnuar pjesë të asistentit të tij të ri virtual Meta AI, por përjashtoi postimet private të ndara vetëm me familjen dhe miqtë në përpjekje për të respektuar privatësinë e konsumatorëve, tregoi ekzekutivi më i lartë i politikave të kompanisë në një intervistë. Tek këto të dhëna publike që u përdorën për të trajnuar këtë asistent u përfshinë si tekstet dhe fotografitë e publikuara.
Meta gjithashtu nuk përdori bisedat private në aplikacionet e saj si të dhëna trajnimi për modelin dhe ndërmori hapa për të filtruar detajet private nga grupet e të dhënave publike të përdorura për trajnime, siç tregon dhe Nick Clegg.
“Ne jemi përpjekur të përjashtojmë grupet e të dhënave që kanë sasi të mëdha të informacionit personal,” tha Clegg, duke shtuar se “shumica dërrmuese” e të dhënave të përdorura nga Meta për trajnime ishin në dispozicion të publikut. Ai përmendi LinkedIn si një shembull të një faqe interneti, përmbajtja e së cilës nuk u zgjodh qëllimisht nga Meta për shkak të shqetësimeve të privatësisë.

Komentet e Clegg vijnë pasi kompanitë e teknologjisë duke përfshirë Meta, OpenAI dhe Google janë kritikuar për përdorimin e informacionit të publikuar ne internet pa leje për të trajnuar modelet e tyre të AI, të cilat thithin sasi masive të dhënash në mënyrë që të përmbledhin informacionin dhe të gjenerojnë imazhe.
Meta e krijoi asistentin duke përdorur një model të personalizuar të bazuar në modelin e fuqishëm gjuhësor Llama 2 që kompania prezantoi për përdorim publik komercial në korrik, si dhe një model të ri të quajtur Emu që gjeneron imazhe në bazë të kërkesave të tekstit.