Sekuencimi i ADN-së është një fushë thelbësore e shkencës moderne, që ka ndihmuar në zbulimin e lidhjeve gjenetike me kancerin, sëmundjet neurodegjenerative dhe diabetin. Por, me rritjen marramendëse të të dhënave të krijuara nga laboratorët në mbarë botën, shkencëtarët po përballen me një problem të ri: sasitë gjigante të informacionit. Arkiva si American Sequence Read Archive dhe European Nucleotide Archive tashmë përmbajnë të dhëna me madhësi në nivel petabaytesh. Menaxhimi, analizimi dhe kërkimi brenda këtyre grumbujve të të dhënave është bërë tepër i vështirë.
Pikërisht këtë sfidë po përpiqen të zgjidhin studiuesit e ETH Zurich, të cilët kanë krijuar një motor kërkimi për ADN-në të quajtur MetaGraph. I publikuar në revistën Nature, MetaGraph kombinon mbi 600 milionë sekuenca të veçanta dhe rreth 21 milionë gigabajt të dhënash në një indeks të vetëm kërkues. E përshkruar si një “Google për ADN-në”, kjo teknologji mund të përshpejtojë ndjeshëm kërkimet gjenetike.
MetaGraph ka nisur zhvillimin në vitin 2020 dhe arrin të kompresojë të dhënat deri 300 herë, duke i kthyer sekuencat e përpunuara në paragrafe të sakta që më pas bashkohen në një indeks unik. Kjo i ka lejuar studiuesit të reduktojnë dataset-e masive prej 100 TB në vetëm 10 GB. Në sistem janë përfshirë sekuenca virusale, mikrobiale, të bimëve, baktereve, kërpudhave dhe njerëzve.
Përfitimi më i madh është se kërkuesit mund të kryejnë kërkime pa shkarkuar dataset-e të mëdha, duke kursyer kohë dhe para. Sot, i gjithë volumi i të dhënave publike të sekuencimit mund të ruhet në disa hard disqe të zakonshëm, dhe çdo kërkim kushton vetëm disa cent, me një kosto totale rreth 2,500 dollarë.
Aktualisht, rreth gjysma e të dhënave globale të sekuencimit është tashmë e kërkueshme në MetaGraph, dhe pjesa tjetër pritet të shtohet deri në fund të vitit 2025. Si mjet open source dhe i shkallëzueshëm, MetaGraph pritet të ndryshojë mënyrën si bëhen kërkimet gjenetike, duke e bërë sekuencimin më të shpejtë, më të lirë dhe më të aksesueshëm për shkencëtarët dhe institucionet në mbarë botën.

