Duke shënuar një moment historik të madh për shkencat biomolekulare, një ekip studiuesish – i përbërë nga shkencëtarë nga UC Berkeley, Instituti Arc, UCSF, Universiteti Stanford dhe NVIDIA – kanë zhvilluar një model të ri machine-learning të trajnuar mbi ADN-në e mbi 100,000 specieve të ndryshme.
Modeli, i quajtur Evo 2, mund të identifikojë modele në sekuencat e gjeneve nëpër organizma të ndryshëm që studiuesve eksperimentalë zakonisht do t’u duhen vite për t’i zbuluar. Përveç identifikimit të mutacioneve që shkaktojnë sëmundje në gjenet njerëzore, Evo 2 mund të projektojë gjenome të reja që janë të gjata sa gjenomet e baktereve të thjeshta.
Ngjashëm në shkallë me modelet më të fuqishme gjeneruese të gjuhëve të mëdha të AI, Evo 2 është modeli më i madh i AI në biologji deri më sot. Duke u mbështetur në paraardhësin e tij Evo 1, i cili u trajnua tërësisht mbi gjenomet njëqelizore, Evo 2 u trajnua në mbi 9.3 trilion nukleotide – blloqet ndërtuese që përbëjnë ADN-në ose ARN-në – nga mbi 128,000 gjenome të plota, si dhe të dhëna metagjenomike.

Përveç një koleksioni të zgjeruar të gjenomave bakteriale, Evo 2 është stërvitur dhe me informacione nga njerëzit, bimët dhe specie të tjera njëqelizore dhe shumëqelizore eukariote.
“Zhvillimi ynë i Evo 1 dhe Evo 2 përfaqëson një moment kyç në fushën në zhvillim të biologjisë gjeneruese, pasi modelet i kanë mundësuar makinave të lexojnë, shkruajnë dhe të mendojnë në gjuhën e nukleotideve,” tha Patrick Hsu, asistent profesor i bioinxhinierisë në UC Berkeley, bashkëthemelues dhe bashkëautor i Institutit Arc.
“Evo 2 ka një kuptim të përgjithshëm të pemës së jetës që është e dobishme për një mori detyrash, nga parashikimi i mutacioneve që shkaktojnë sëmundje deri te hartimi i kodit të mundshëm për jetën artificiale. Ne jemi të emocionuar për të parë se çfarë do të ndërtojë komuniteti i kërkimit përmes ndihmës së këtyre modeleve.”