Në një dokumentar të vitit 2017, They Shall Not Grow Old, që flet rreth jetës së ushtarëve nga Britania dhe Zelanda e re që jetuan gjatë Luftës së Parë Botërore, u punësua një ekip lexuesish buzësh për të regjistruar audion jo ekzistuese të regjistrimeve të vjetra, dhe besohet se ato bënë një punë shumë të mirë duke përcaktuar madje dhe dialektin e folësve.
Mirëpo një studim në vitin 2009 tregoi se shumica e njerëzve mund të lexojnë buzët vetëm me një saktësi prej 20%, dhe një lexues i stërvitur mund të lexojë vetëm 4-5 fjalë në një fjali me 12 fjalë.
Për njerëzit është shumë e vështirë që të lexojnë lëvizjen e buzëve. Ju do të hasni vështirësi të lexoni, dhe nëse kuptoni 3 nga 10 fjalë atëherë do të konsideroheni ndër më të mirë në këtë “sport”.
Mirëpo këtu ndërhyn teknologjia, e cila është më e aftë se ne në leximin e buzëve. Për sistemet e reja machine learning, leximi i lëvizjes së buzëve është tepër i thjeshtë dhe arrin të regjistrojë një saktësi prej 95%. Me përmirësimin e inteligjencës artificiale dita – ditës, kjo përqindje mund të rritet akoma dhe më tepër.
Një ekip studiuesish iranianë treguan në 2021 se ka një diferencë kryesore midis leximit të buzëve nga ana e personave të ndryshëm dhe teknologjisë AI. “Zakonisht njerëzit janë tepër përtacë dhe mbështeten në kontekstin e bisedës pasi ne kemi shumë njohuri të mëparshme, ndërkohë që teknologjia tenton të konvertojë informacionin vizual në fjalë.”