O imagine a ADN-ului digitalizat cu diferite secvențe în culori strălucitoare.

Modelul de învățare automată Evo poate prezice și genera secvențe de ADN și ARN din cele mai mici componente ale acestora. (Credit imagine: Getty Images/Yuichiro Chino)

Oamenii de știință au dezvoltat un nou tip de model de învățare automată care poate înțelege și proiecta instrucțiuni genetice.

Modelul, numit Evo, poate prezice efectele mutațiilor genetice și poate genera noi secvențe de ADN – deși acele secvențe de ADN nu se potrivesc îndeaproape cu ADN-ul organismelor vii.

Cu timpul și pregătirea, totuși, Evo și modelele similare ar putea ajuta oamenii de știință să înțeleagă funcțiile diferitelor secvențe de ADN și ARN și să atenueze boala, au scris cercetătorii într-un nou studiu publicat pe 15 noiembrie în jurnal. Ştiinţă.

Evo este un tip de inteligenţă artificială (AI) numit model de limbă mare (LLM), care este similar cu GPT-4 al OpenAI sau cu cel al Google Gemenii. Cercetătorii și dezvoltatorii instruiesc LLM-urile pe cantități mari de date din resurse disponibile public, cum ar fi internetul, iar LLM-urile caută modele, cum ar fi fraze obișnuite sau structuri tipice de propoziție, folosind acele modele pentru a furniza cuvinte într-o propoziție unul câte unul.

Înrudit: Omenirea se confruntă cu un viitor „catastrofal” dacă nu reglementăm inteligența artificială, spune Yoshua Bengio „Nașul inteligenței artificiale”.

Spre deosebire de mai multe LLM-uri obișnuite, Evo nu este instruit pe cuvinte. În schimb, este instruit pe genomul a milioane de microbi – arheea, bacteriile și virușii care le infectează, dar nu și organisme eucariote precum plantele și animalele. Fiecare pereche de baze – unitățile chimice de bază care alcătuiesc ADN-ul – din acești genomi acționează ca un „cuvânt” în model. Evo compară apoi secvențele de perechi de baze cu setul său de antrenament pentru a prezice modul în care va funcționa o catenă de ADN sau pentru a genera material genetic nou.

Alte modele au folosit deja învățarea automată și chiar LLM-urile pentru a examina informațiile genetice. Dar până acum au fost limitate la funcții specializate sau îngreunate de costuri de calcul ridicate, au scris oamenii de știință în studiu. Evo, prin contrast, folosește un model rapid, de înaltă rezoluție pentru a procesa șiruri lungi de informații, permițându-i să analizeze modele la scara genomului și să capteze informații despre interacțiunile la scară largă pe care modelele mai specializate le-ar putea pierde.

Primiți cele mai fascinante descoperiri din lume direct în căsuța dvs. de e-mail.

Autorii au testat Evo pe o serie de sarcini. Evo a prezis modul în care mutațiile genetice ar afecta structurile proteinelor, performanțe comparabile cu modelele antrenate special pentru această sarcină. De asemenea, a generat un set de componente de proteine ​​și ARN care au protejat împotriva infecțiilor virale în testele de laborator.

Evo a generat chiar și secvențe de ADN de mărimea genomului întreg – dar acel ADN nu ar menține neapărat ceva în viață. Unele dintre instrucțiunile genetice erau similare cu ADN-ul din organismele existente. Alții arătau similar la prima vedere, dar nu aveau sens la o inspecție mai atentă, similar cu o imagine generată de AI a unei persoane cu prea multe degete. De exemplu, multe dintre structurile proteice codificate în ADN-ul generat de Evo nu se potrivesc cu proteinele naturale.

„Aceste mostre reprezintă o „imagine neclară” a unui genom care conține caracteristici cheie, dar nu are detaliile cu granulație mai fină tipice genomurilor naturale”, au scris cercetătorii în studiu.

De asemenea, ei l-au instruit pe Evo doar pe genomi microbieni, așa că prezicerea efectelor mutațiilor genetice umane nu este încă la îndemână. În mod critic, echipa a subliniat necesitatea unor linii directoare de siguranță și etică pentru a preveni utilizarea greșită a instrumentelor precum Evo pe măsură ce performanța lor se îmbunătățește. În special, echipa a exclus datele despre genomi virali care infectează gazde eucariote.

„O discuție proactivă care să implice comunitatea științifică, experți în securitate și factorii de decizie politică este imperativă pentru a preveni utilizarea abuzivă și pentru a promova strategii eficiente pentru atenuarea amenințărilor existente și emergente”, au scris cercetătorii.

Skyler Ware este un jurnalist științific independent care acoperă chimie, biologie, paleontologie și știința Pământului. Ea a fost 2023 AAAS Mass Media Science and Engineering Fellow la Science News. Lucrarea ei a apărut și în Science News Explores, ZME Science și Chembites, printre altele. Skyler are un doctorat. în chimie de la Caltech.

Chat Icon
×