Un sistem AI de la Google citește mutațiile ADN-ului. Google lansează AlphaGenome, un model revoluționar de Inteligență Artificială care prezice impactul mutațiilor ADN.
Un sistem AI de la Google prezice consecințele moleculare ale mutațiilor din ADN. Google a anunțat un progres major în domeniul genomicii odată cu lansarea AlphaGenome, un model de Inteligență Artificială de înaltă performanță care poate prezice cum o singură mutație ADN afectează mecanismele complexe ce reglează activitatea genelor.
AlphaGenome analizează atât regiunile codante, cât și pe cele necodante ale genomului, oferind pentru prima dată o imagine unificată a modului în care mutațiile pot influența funcționarea acestuia.
Modelul aduce o perspectivă detaliată la nivel de bază asupra analizelor genomice pe distanțe lungi, permițând evaluarea rapidă, la scară largă și cu o profunzime fără precedent a impactului mutațiilor. AlphaGenome poate procesa până la 1 milion de perechi de baze din ADN dintr-o singură trecere și face predicții asupra a mii de proprietăți moleculare: expresia genelor, modelele de splicing (decupare ARN), locurile de legare ale proteinelor și accesibilitatea cromatinei în diferite tipuri de celule, scrie Interesting Engineering.
Este pentru prima dată când atât de multe caracteristici reglatoare pot fi modelate împreună într-un singur sistem AI.
AlphaGenome folosește inițial straturi convoluționale pentru a identifica modele scurte din secvențele ADN, apoi aplică arhitecturi de tip transformer pentru a transmite informația pe întreg segmentul genetic. Straturi finale convertesc aceste modele în predicții pentru diferite funcții genomice. Pentru antrenare, calculele pentru o singură secvență sunt distribuite pe mai multe Tensor Processing Units (TPU), accelerând procesarea la scară mare.
Modelul a fost antrenat în doar patru ore, folosind doar jumătate din puterea de calcul necesară predecesorului său, Enformer.
Ca succesor al lui Enformer și complementar lui AlphaMissense, AlphaGenome este singurul model capabil să prezică simultan toate tipurile de proprietăți moleculare evaluate, depășind sau egalând modele specializate în 24 dintre cele 26 de teste de referință.
Modelul a fost antrenat pe seturi de date publice de mari dimensiuni, cum ar fi ENCODE, GTEx, 4D Nucleome și FANTOM5. Spre deosebire de modelele anterioare care sacrificau rezoluția pentru a analiza secvențe mai lungi, AlphaGenome reușește să le echilibreze pe ambele, oferind predicții precise la nivel de bază și context genomic pe distanțe lungi. Această abilitate deschide noi perspective în biologia bolilor, studierea variantelor rare, designul de ADN sintetic și multe altele.
Un element remarcabil este sistemul de scoring pentru mutații, care compară eficient ADN-ul mutant cu cel nemutant pentru a evalua impactul asupra mai multor tipuri de activitate genomică.
Modelul include și o abordare unică de modelare a splice-junctionurilor, utilă pentru prezicerea perturbărilor în splicingul ARN asociate cu boli precum fibroza chistică sau atrofia musculară spinală. În biologia sintetică, AlphaGenome ar putea ajuta la crearea de secvențe reglatoare care activează selectiv gene doar în anumite celule, de exemplu, în neuroni, dar nu în celulele musculare.
Modelul este promițător și în studierea variantelor genetice rare cu efecte biologice puternice, precum cele care stau la baza unor boli ereditare.
Într-un caz de test, AlphaGenome a prezis cu acuratețe modul în care o mutație asociată cu leucemia creează un loc de legare pentru proteina MYB, activând gena TAL1, un mecanism cunoscut în leucemia limfoblastică acută cu celule T. Astfel, modelul demonstrează capacitatea de a lega variantele necodante de gene implicate în boli.
Cu toate acestea, AlphaGenome nu este destinat sau validat pentru interpretarea genomurilor personale ori pentru uz clinic. Modelul încă întâmpină dificultăți în analizarea interacțiunilor reglatoare aflate la peste 100.000 de baze ADN distanță și în captarea completă a tiparelor specifice celulelor și țesuturilor.
Totuși, cercetătorii susțin că AlphaGenome oferă o fundație solidă pentru dezvoltări viitoare și poate fi adaptat la alte specii, tipuri de date și experimente de laborator.
Modelul este disponibil în versiune preliminară, exclusiv pentru uz necomercial, prin API-ul AlphaGenome. Google încurajează comunitatea de cercetare globală să exploreze aplicațiile modelului, să adreseze întrebări și să ofere feedback.
„Sperăm că AlphaGenome va aprofunda înțelegerea noastră asupra proceselor celulare complexe codificate în ADN și va stimula noi descoperiri în genomică și sănătate”, a transmis Google.
Sandvișul perfect începe cu pâinea perfectă: sfaturi de la maeștrii aluatului
Pilates: mitul mușchilor „lungi și supli”. Ce spune știința?
Pentru prima dată, celule din afara creierului au prezentat semne de memorie și „învățare”
Un algoritm dezvăluie o mică regiune din creierul nostru cu un rol-cheie