diverse

„Moment ChatGPT pentru biologie”: foștii oameni de știință Meta dezvoltă un model AI care creează proteine ​​„care nu se găsesc în natură”

„moment-chatgpt-pentru-biologie”:-fostii-oameni-de-stiinta-meta-dezvolta-un-model-ai-care-creeaza-proteine-​​„care-nu-se-gasesc-in-natura”
Reprezentarea vizuală a proteinei esmGPF a EvolutionaryScale

Proteina esmGPF a fost generată de modelul ESM3 și nu seamănă cu oricare dintre cele găsite în natură. Oamenii de știință susțin că ar fi fost nevoie de 500 de milioane de ani de evoluție pentru ao crea. (Credit imagine: EvolutionaryScale)

La fel cum ChatGPT generează text prin prezicerea cuvântului cel mai probabil să urmeze într-o secvență, un nou inteligenţă artificială Modelul (AI) poate scrie noi proteine ​​care nu apar în mod natural de la zero.

Oamenii de știință au folosit noul model, ESM3, pentru a crea o nouă proteină fluorescentă care împărtășește doar 58% din secvența sa cu proteinele fluorescente care apar în mod natural, au spus ei într-un studiu publicat pe 2 iulie pe preprint. baza de date bioRxiv. Reprezentanții de la EvolutionaryScale, o companie formată din foști cercetători Meta, au subliniat și ei detalii pe 25 iunie într-un afirmație.

Echipa de cercetare a lansat un versiunea mică a modelului sub o licență necomercială și va pune la dispoziția cercetătorilor comerciali versiunea mare a modelului. Potrivit EvolutionaryScale, tehnologia ar putea fi utilă în domenii, de la descoperirea de medicamente până la proiectarea de noi substanțe chimice pentru degradarea plasticului.

ESM3 este un model de limbaj mare (LLM) similar cu GPT-4 de la OpenAI, care alimentează chatbot-ul ChatGPT, iar oamenii de știință și-au antrenat cea mai mare versiune pe 2,78 miliarde de proteine. Pentru fiecare proteină, au extras informații despre secvență (ordinea blocurilor de aminoacizi care alcătuiesc proteina), structură (forma tridimensională pliată a proteinei) și funcție (ce face proteina). Ei au mascat aleatoriu informații despre aceste proteine ​​și au cerut ca ESM3 să prezică piesele lipsă.

Ei au mărit acest model din cercetările pe care aceeași echipă le desfășura încă la Meta. În 2022 ei a anunțat EMSFold – un precursor al ESM3 care a prezis structuri de proteine ​​microbiene necunoscute. În acel an, Alphabet’s DeepMind de asemenea structurile proteinelor prezise pentru 200 de milioane de proteine.

Legate de: Programul AI al DeepMind AlphaFold3 poate prezice structura fiecărei proteine ​​din univers și arăta cum funcționează acestea.

Oamenii de știință au subliniat ulterior că există limitări ale predicțiilor acestor modele AI și că predicțiile proteice trebuie verificate. Dar metodele pot încă accelera masiv căutarea structurilor de proteine, deoarece alternativa este utilizarea razelor X pentru a mapa structurile proteinelor una câte una – ceea ce este lent și costisitor.

Primiți cele mai fascinante descoperiri din lume direct în căsuța dvs. de e-mail.

Cu toate acestea, ESM3 depășește doar prezicerea proteinelor existente. Folosind informațiile culese din 771 de miliarde de informații unice despre structură, funcție și secvență, modelul poate genera noi proteine ​​cu funcții specifice. A fost descris ca un „moment ChatGPT pentru biologie” de unul dintre susținătorii lui EvolutionaryScale.

În noul studiu, cercetătorii au chestionat modelul pentru a genera o nouă proteină fluorescentă – un fel de proteină care captează lumina și o eliberează înapoi la o lungime de undă mai mare, făcând-o să strălucească într-o nouă nuanță de verde. Aceste proteine ​​sunt importante pentru cercetătorii biologici care le atașează la moleculele pe care sunt interesați să le studieze pentru a le urmări și a crea imagini; descoperirea și dezvoltarea lor a câștigat a Premiul Nobel pentru chimie în 2008.

Modelul a generat 96 de proteine ​​cu secvențe și structuri susceptibile de a produce fluorescență. Cercetatorii au ales apoi una cu cele mai putine secvente in comun cu proteinele fluorescente natural. Deși această proteină a fost de 50 de ori mai puțin strălucitoare decât proteinele fluorescente verzi naturale, ESM3 a generat o altă iterație care a condus la noi secvențe care au crescut luminozitatea – iar rezultatul a fost o proteină verde fluorescentă, diferită de orice găsită în natură, denumită „esmGPF”. Aceste iterații, realizate în câteva momente de către IA, ar dura 500 de milioane de ani de evoluție pentru a fi realizate, a estimat echipa EvolutionaryScale.

Analiza de către

Tiffany Taylor, profesor la Universitatea din Bath

„În acest moment, încă ne lipsește înțelegerea fundamentală a modului în care proteinele, în special cele „noi în știință”, se comportă atunci când sunt introduse într-un sistem viu, dar acesta este un nou pas grozav care ne permite să abordăm biologia sintetică într-un mod nou. AI. Modelarea precum ESM3 va permite descoperirea de noi proteine ​​pe care constrângerile selecției naturale nu le-ar permite niciodată, creând inovații în ingineria proteinelor pe care evoluția nu le poate face , care nu ține cont de multele etape ale selecției naturale care creează diversitatea vieții pe care o cunoaștem astăzi. Ingineria proteinelor condusă de inteligență artificială este intrigantă, dar nu mă pot abține să simt că am putea fi prea încrezători în a presupune că putem depăși procesele complicate. perfecționat de milioane de ani de selecție naturală.”

Stephanie Pappas este un scriitor care contribuie la Live Science, acoperind subiecte variind de la geoștiință la arheologie la creierul uman și comportamentul. Anterior a fost scriitoare senior pentru Live Science, dar acum este freelancer cu sediul în Denver, Colorado și contribuie în mod regulat la Scientific American și The Monitor, revista lunară a Asociației Americane de Psihologie. Stephanie a primit o diplomă de licență în psihologie de la Universitatea din Carolina de Sud și un certificat de absolvire în comunicare științifică de la Universitatea din California, Santa Cruz.

To top
Cluburile Știință&Tehnică
Prezentare generală a confidențialității

Acest site folosește cookie-uri pentru a-ți putea oferi cea mai bună experiență în utilizare. Informațiile cookie sunt stocate în navigatorul tău și au rolul de a te recunoaște când te întorci pe site-ul nostru și de a ajuta echipa noastră să înțeleagă care sunt secțiunile site-ului pe care le găsești mai interesante și mai utile.