Toată lumea poate fi înlocuită –

AI „Coscientist” verifică referințele, citește manuale hardware și stabilește reacții.

Imaginea unui laborator cu substanțe chimice, dar fără persoane prezente.

Mărește / Laboratorul este gol pentru că toată lumea se relaxează în parc în timp ce AI își face treaba.

În ciuda progreselor rapide în inteligența artificială, IA nu sunt nicăieri aproape de fiind gata să înlocuiască oamenii pentru a face știință. Dar asta nu înseamnă că nu se pot ajuta să automatizeze o parte din greleala din rutina zilnică a experimentelor științifice. De exemplu, cu câțiva ani în urmă, cercetătorii au pus o IA în controlul echipamentelor automate de laborator și au învățat-o să facă acest lucru catalogați exhaustiv toate reacțiile care poate apărea între un set de materii prime.

Deși util, asta a necesitat totuși multă intervenție a cercetătorilor pentru a instrui sistemul în primul rând. Un grup de la Universitatea Carnegie Mellon și-a dat seama acum cum să obțină un sistem AI care să învețe singur să facă chimie. Sistemul necesită un set de trei instanțe AI, fiecare specializată pentru operațiuni diferite. Dar, odată instalat și aprovizionat cu materii prime, trebuie doar să-i spui ce tip de reacție vrei să faci și își va da seama.

O trinitate AI

Cercetătorii indică faptul că au fost interesați să înțeleagă ce capacități pot aduce modelele de limbaj mari (LLM) în demersul științific. Așadar, toate sistemele AI utilizate în această lucrare sunt LLM-uri, în principal GPT-3.5 și GPT-4, deși unele altele – Claude 1.3 și Falcon-40B-Instruct – au fost și ele testate. (GPT-4 și Claude 1.3 au avut cele mai bune rezultate.) Dar, în loc să folosească un singur sistem pentru a gestiona toate aspectele chimiei, cercetătorii au creat instanțe distincte pentru a coopera într-o configurație de diviziune a muncii și l-au numit „Coscientist”.

Cele trei sisteme pe care le-au folosit sunt:

Căutare web. Aceasta are două capacități principale. Una este să utilizați API-ul de căutare Google pentru a găsi pagini care ar putea merita să fie ingerate pentru informațiile pe care le conțin. Al doilea este să ingerați acele pagini și să extrageți informații din ele – gândiți-vă la asta ca fiind similar cu contextul porțiunilor anterioare ale unei conversații pe care Chat GPT le poate menține pentru a-și informa răspunsurile ulterioare. Cercetătorii au putut urmări unde își petrece timpul acest modul și aproximativ jumătate din locurile pe care le-a vizitat erau pagini Wikipedia. Primele cinci site-uri pe care le-a vizitat au inclus reviste publicate de Societatea Americană de Chimie și Societatea Regală de Chimie.

Căutare documentație. Gândiți-vă la asta ca la RTFM instanță. AI urma să primească controlul asupra diferitelor echipamente de automatizare a laboratorului, cum ar fi manipulatoarele robotice de fluide și altele, controlate adesea fie prin comenzi specializate, fie prin ceva asemănător unui API python. Această instanță AI a primit acces la toate manualele pentru acest echipament, permițându-i să-și dea seama cum să-l controleze.

Planificator. Planificatorul poate emite comenzi celorlalte două instanțe AI și poate procesa răspunsurile acestora. Are acces la un sandbox Python pentru a executa cod, permițându-i să efectueze calcule. De asemenea, are acces la echipamentele automate de laborator, permițându-i să efectueze și să analizeze efectiv experimente. Deci, vă puteți gândi la planificator ca la porțiunea sistemului care trebuie să acționeze ca un chimist, învățând din literatură și încercând să folosească echipamente pentru a implementa ceea ce a învățat.

Planificatorul este, de asemenea, capabil să determine când apar erori software (fie în scripturile sale Python, fie în încercările sale de a controla hardware-ul automat), permițându-i să-și corecteze greșelile.

Punerea în funcțiune a sistemului

Inițial, i s-a cerut sistemului să sintetizeze o serie de substanțe chimice, cum ar fi acetaminofenul și ibuprofenul, confirmând că, în general, ar putea găsi o sinteză viabilă după căutarea pe web și în literatura științifică. Deci, întrebarea este dacă sistemul și-a putut da seama de hardware-ul la care avea acces suficient de bine pentru a-și pune capacitatea conceptuală să funcționeze.

Pentru a începe cu ceva simplu, cercetătorii au folosit o placă de probă standard, care deține o grămadă de puțuri mici dispuse într-o grilă dreptunghiulară. Sistemului i s-a cerut să completeze pătrate, dungi diagonale sau alte modele folosind diverse lichide colorate și a reușit să facă acest lucru eficient.

Trecând mai departe, au plasat trei soluții colorate diferite în locații aleatorii din grila puțurilor; sistemului i sa cerut să identifice ce puțuri au ce culoare. Pe cont propriu, Coscientist nu știa cum să facă asta. Dar când i s-a primit un prompt care i-a reamintit că diferitele culori ar arăta diferite spectre de absorbție, a folosit un spectrograf la care avea acces și a fost capabil să identifice diferitele culori.

Cu comanda și controlul de bază aparent funcțional, cercetătorii au decis să încerce ceva chimie. Ei au furnizat o placă de probă cu godeuri umplute cu substanțe chimice simple, catalizatori și altele asemenea și i-au cerut să efectueze o reacție chimică specifică. Coscientist a obținut chimia chiar de la început, dar încercările sale de a rula sinteza au eșuat, deoarece a trimis o comandă invalidă hardware-ului care încălzește și stârnește reacțiile. Aceasta a trimis-o înapoi la modulul de documentare, permițându-i să corecteze problema și să ruleze reacții.

Și a funcționat. Semnăturile spectrale ale produselor dorite au fost prezente în amestecul de reacție și prezența lor a fost confirmată prin cromatografie.

Optimizare

Cu reacțiile de bază funcționale, cercetătorii au cerut apoi sistemului să îmbunătățească eficiența reacției – au prezentat procesul de optimizare ca un joc în care scorul ar crește odată cu randamentul reacției.

Sistemul a făcut niște presupuneri proaste în prima rundă de reacții de testare, dar sa concentrat rapid pe randamente mai bune. De asemenea, cercetătorii au descoperit că ar putea evita alegerile proaste din prima rundă, oferind lui Coscientist informații despre randamentele generate de o mână de amestecuri de pornire aleatorii. Acest lucru implică faptul că nu contează de unde își obține Coscientist informațiile – fie din reacțiile pe care le rulează, fie dintr-o sursă externă de informații – este capabil să încorporeze informațiile în planificarea sa.

Cercetătorii concluzionează că Coscientist are mai multe capacități notabile:

  • Planificarea sintezei chimice folosind informații publice
  • Navigarea și procesarea manualelor tehnice pentru hardware complicat
  • Folosind aceste cunoștințe pentru a controla o serie de echipamente de laborator
  • Integrarea acestor capabilități de manipulare hardware într-un flux de lucru de laborator
  • Analizându-și propriile reacții și folosind acele informații pentru a proiecta condiții de reacție îmbunătățite.

În multe feluri, aceasta sună ca experiența pe care o poate avea un student în primul an de studii superioare. În mod ideal, studentul absolvent va progresa dincolo de asta. Dar poate că și GPT-5 va putea.

Mai serios, structura Coscientist, care se bazează pe interacțiunea unui număr de sisteme specializate, este similară cu modul în care funcționează creierul. Evident, sistemele specializate ale creierului sunt capabile de o gamă mult mai largă de activități și sunt mult mai multe dintre ele. Dar se poate ca acest tip de structură să fie critic pentru a permite un comportament mai complicat.

Acestea fiind spuse, cercetătorii înșiși sunt îngrijorați de unele dintre capacitățile lui Coscientist. Există o mulțime de substanțe chimice (gândiți-vă la lucruri precum gazele nervoase) pe care nu vrem să le vedem mai ușor de sintetizat. Și să descoperi cum să le spui instanțelor GPT să nu facă ceva a devenit o provocare continuă.

Natura, 2023. DOI: 10.1038/s41586-023-06792-0 (Despre DOI).

×