Oamenii de știință au dezvoltat un nou tip de model de învățare automată care poate înțelege și proiecta instrucțiuni genetice.
Modelul, numit Evo, poate prezice efectele mutațiilor genetice și poate genera noi secvențe de ADN – deși acele secvențe de ADN nu se potrivesc îndeaproape cu ADN-ul organismelor vii.
Cu timpul și pregătirea, totuși, Evo și modelele similare ar putea ajuta oamenii de știință să înțeleagă funcțiile diferitelor secvențe de ADN și ARN și să atenueze boala, au scris cercetătorii într-un nou studiu publicat pe 15 noiembrie în jurnal. Ştiinţă.
Evo este un tip de inteligenţă artificială (AI) numit model de limbă mare (LLM), care este similar cu GPT-4 al OpenAI sau cu cel al Google Gemenii. Cercetătorii și dezvoltatorii instruiesc LLM-urile pe cantități mari de date din resurse disponibile public, cum ar fi internetul, iar LLM-urile caută modele, cum ar fi fraze obișnuite sau structuri tipice de propoziție, folosind acele modele pentru a furniza cuvinte într-o propoziție unul câte unul.
Spre deosebire de mai multe LLM-uri obișnuite, Evo nu este instruit pe cuvinte. În schimb, este instruit pe genomul a milioane de microbi – arheea, bacteriile și virușii care le infectează, dar nu și organisme eucariote precum plantele și animalele. Fiecare pereche de baze – unitățile chimice de bază care alcătuiesc ADN-ul – din acești genomi acționează ca un „cuvânt” în model. Evo compară apoi secvențele de perechi de baze cu setul său de antrenament pentru a prezice modul în care va funcționa o catenă de ADN sau pentru a genera material genetic nou.
Alte modele au folosit deja învățarea automată și chiar LLM-urile pentru a examina informațiile genetice. Dar până acum au fost limitate la funcții specializate sau îngreunate de costuri de calcul ridicate, au scris oamenii de știință în studiu. Evo, prin contrast, folosește un model rapid, de înaltă rezoluție pentru a procesa șiruri lungi de informații, permițându-i să analizeze modele la scara genomului și să capteze informații despre interacțiunile la scară largă pe care modelele mai specializate le-ar putea pierde.
Autorii au testat Evo pe o serie de sarcini. Evo a prezis modul în care mutațiile genetice ar afecta structurile proteinelor, performanțe comparabile cu modelele antrenate special pentru această sarcină. De asemenea, a generat un set de componente de proteine și ARN care au protejat împotriva infecțiilor virale în testele de laborator.
Evo a generat chiar și secvențe de ADN de mărimea genomului întreg – dar acel ADN nu ar menține neapărat ceva în viață. Unele dintre instrucțiunile genetice erau similare cu ADN-ul din organismele existente. Alții arătau similar la prima vedere, dar nu aveau sens la o inspecție mai atentă, similar cu o imagine generată de AI a unei persoane cu prea multe degete. De exemplu, multe dintre structurile proteice codificate în ADN-ul generat de Evo nu se potrivesc cu proteinele naturale.
„Aceste mostre reprezintă o „imagine neclară” a unui genom care conține caracteristici cheie, dar nu are detaliile cu granulație mai fină tipice genomurilor naturale”, au scris cercetătorii în studiu.
De asemenea, ei l-au instruit pe Evo doar pe genomi microbieni, așa că prezicerea efectelor mutațiilor genetice umane nu este încă la îndemână. În mod critic, echipa a subliniat necesitatea unor linii directoare de siguranță și etică pentru a preveni utilizarea greșită a instrumentelor precum Evo pe măsură ce performanța lor se îmbunătățește. În special, echipa a exclus datele despre genomi virali care infectează gazde eucariote.
„O discuție proactivă care să implice comunitatea științifică, experți în securitate și factorii de decizie politică este imperativă pentru a preveni utilizarea abuzivă și pentru a promova strategii eficiente pentru atenuarea amenințărilor existente și emergente”, au scris cercetătorii.
Comentarii recente