Un inteligenţă artificială (AI) Modelul a simulat jumătate de miliard de ani de evoluție moleculară pentru a crea codul pentru o proteină necunoscută anterior, potrivit unui nou studiu. Proteina strălucitoare, care este similară cu cele găsite în meduze și corali, poate ajuta la dezvoltarea de noi medicamente, spun cercetătorii.
Proteinele sunt unul dintre blocurile de viață ale vieții și îndeplinesc diverse funcții în corp, cum ar fi Construirea mușchilor și lupta cu boala. Proteina simulată, numită ESMGFP, există doar ca cod computerizat, dar conține modelul pentru un tip de proteină fluorescentă verde necunoscută anterior. În natură, proteinele fluorescente verzi dau meduze fluorescente și coralii strălucirea lor.
Secvența de litere care explică instrucțiunile pentru a face ESMGFP este de doar 58% similară cu cea mai apropiată proteină fluorescentă cunoscută, care este o versiune modificată de om a unei proteine găsite în anemonele de mare cu vârful cu bule (Entacmaea Quadricolor) – Creaturi colorate de mare care arată ca au bule pe capetele tentaculelor lor. Restul secvenței este unic și ar necesita un total de 96 de mutații genetice diferite pentru a evolua. Aceste modificări ar fi durat mai mult de 500 de milioane de ani pentru a evolua în mod natural, potrivit studiului.
Cercetătorii de la o companie numită EvolutionaryScale Dezvăluit ESMGFP și modelul AI folosit pentru a -l crea, ESM3, într -un studiu de preprint anul trecut. Oamenii de știință independenți au acum revizuit de la egal la egal, care au fost publicate pe 16 ianuarie în Jurnal Ştiinţă.
ESM3 nu proiectează proteine în constrângerile obișnuite ale evoluției. În schimb, este un soluționare a problemelor care completează lacunele codului proteic incomplet furnizat de cercetători și, în acest sens, proiectează ceva care ar putea exista pe baza tuturor potențialelor evoluții ale căilor.
„Am constatat că ESM3 învață biologia fundamentală și poate genera proteine funcționale în afara spațiului explorat de evoluție”, coautor al studiului Alex Rivesa declarat co-fondator și șef de știință al EvolutionaryScale, a declarat Live Science într-un e-mail.
Noul studiu se bazează pe cercetări care Rives și colegii săi a început la metacompania-mamă a Facebook și Instagram, înainte de a începe EvolutionaryScale în 2024. ESM3 este cea mai recentă versiune a unui model de limbaj generativ similar cu GPT-4 al lui OpenAI, care rulează ChatGPT, dar se bazează pe biologie.
Proteinele sunt alcătuite din lanțuri de molecule numite aminoacizi, a căror secvență este furnizată de gene. Diferite proteine au secvențe de aminoacizi diferite. De asemenea, diferă structural, fiecare pliat într -o formă unică care le permite să își îndeplinească funcția, conform Educația naturii. Pentru ca ESM3 să înțeleagă proteinele, cercetătorii au alimentat datele modelului asupra proprietăților principale ale unei proteine - secvență, structură și funcție de aminoacizi – ca o serie de litere.
Echipa a antrenat ESM3 pe date de la 2,78 miliarde de proteine găsite în natură. Cercetătorii au ascuns apoi părți ale unui plan proteic și au avut prizele ESM3 în lacunele pentru a completa codul pe baza a ceea ce a învățat.
„În același mod în care o persoană poate completa semifabricatele din soliloquy” până la _ sau nu pentru a _, adică _ „, putem antrena un model de limbă pentru a completa semifabricatele din proteine”, a spus Rives. „Cercetările noastre au arătat că, prin rezolvarea acestei sarcini simple, în rețea apar informații despre structura profundă a biologiei proteice.”
Oamenii de știință modifică deja proteinele naturale și inginerii noilor pentru o varietate de scopuri. De exemplu, proteinele fluorescente verzi sunt utilizate pe scară largă în laboratoarele de cercetare. Codul lor genetic este adesea adăugat la capetele altor secvențe de ADN pentru a transforma proteinele pe care le codifică verde. Acest lucru permite oamenilor de știință să urmărească cu ușurință proteinele și procesele celulare. Rives a menționat că capacitățile ESM3 pot accelera o gamă largă de aplicații pentru inginerie proteică, inclusiv cu ajutorul proiectării de noi medicamente.
Tiffany Taylorun biolog evolutiv la Universitatea din Bath din Marea Britanie, care nu a fost implicat în cercetare, a raportat despre versiunea de preimprimare a studiului pentru știința live din 2024. În analiza ei, Taylor a scris că modelele AI precum ESM3 vor permite inovații în proteine Inginerie, această evoluție nu poate. Cu toate acestea, ea a menționat, de asemenea, că afirmația cercetătorilor de a simula 500 de milioane de ani de evoluție este axată doar pe proteinele individuale și nu ține cont de numeroasele etape ale selecției naturale care creează în cele din urmă viață.
„Ingineria proteică bazată pe AI este intrigantă, dar nu pot să nu simt că am putea fi excesiv de încrezători în a presupune că putem înlătura procesele complexe perfecționate de milioane de ani de selecție naturală”, a spus Taylor.
Comentarii recente