Prin unele măsuri, sistemele AI sunt acum competitive cu metodele tradiționale de calcul pentru generarea de prognoze meteo. Deoarece pregătirea lor penalizează erorile, totuși, prognozele tind să devină „neclare” – pe măsură ce avansați în timp, modelele fac mai puține predicții specifice, deoarece acestea sunt mai probabil să fie greșite. Ca rezultat, începi să vezi lucruri precum urmele furtunilor lărgindu-se și furtunile în sine pierzând marginile clar definite.

Dar utilizarea AI este încă extrem de tentantă, deoarece alternativa este un model de circulație atmosferică computațională, care necesită un calcul extrem de intens. Totuși, are un mare succes, modelul de ansamblu de la Centrul European de Prognoze Meteorologice pe Interval Mediu considerat cel mai bun din clasă.

Într-o lucrare publicată astăzi, DeepMind de la Google susține că noul său sistem AI reușește să depășească modelul european în ceea ce privește prognozele de cel puțin o săptămână și, adesea, mai mult. Sistemul DeepMind, numit GenCast, îmbină unele abordări computaționale utilizate de oamenii de știință din atmosferă cu un model de difuziefolosit în mod obișnuit în IA generativă. Rezultatul este un sistem care menține rezoluția ridicată, reducând în același timp costurile de calcul semnificativ.

Prognoza de ansamblu

Metodele de calcul tradiționale au două avantaje principale față de sistemele AI. Primul este că se bazează direct pe fizica atmosferică, încorporând regulile pe care le cunoaștem care guvernează comportamentul vremii noastre reale și calculează unele dintre detalii într-un mod care este informat direct de datele empirice. Ele sunt, de asemenea, rulate ca ansambluri, ceea ce înseamnă că sunt rulate mai multe instanțe ale modelului. Datorită naturii haotice a vremii, aceste curse diferite vor diverge treptat, oferind o măsură a incertitudinii prognozei.

S-a făcut cel puțin o încercare de a îmbina unele dintre aspectele modelelor meteorologice tradiționale cu sistemele AI. Un proiect intern Google a folosit un model tradițional de circulație atmosferică care a împărțit suprafața Pământului într-o rețea de celule, dar a folosit o inteligență artificială. pentru a prezice comportamentul fiecărei celule. Acest lucru a oferit performanțe de calcul mult mai bune, dar în detrimentul celulelor de grilă relativ mari, ceea ce a dus la o rezoluție relativ scăzută.

Pentru abordarea predicțiilor meteorologice AI, DeepMind a decis să ignore fizica și să adopte în schimb capacitatea de a conduce un ansamblu.

Gen Cast se bazează pe modele de difuzie, care au o caracteristică cheie care este utilă aici. În esență, aceste modele sunt antrenate pornindu-le cu un amestec de un original – imagine, text, model meteorologic – și apoi o variație în care se injectează zgomot. Sistemul ar trebui să creeze o variație a versiunii zgomotoase care este mai apropiată de originală. Odată antrenat, poate fi alimentat cu zgomot pur și poate evolua zgomotul pentru a fi mai aproape de ceea ce vizează.

În acest caz, ținta sunt date meteo realiste, iar sistemul preia o intrare de zgomot pur și o evoluează pe baza stării actuale a atmosferei și a istoriei sale recente. Pentru prognozele pe termen mai lung, „istoricul” include atât datele reale, cât și datele prezise din prognozele anterioare. Sistemul avansează în pași de 12 ore, astfel că prognoza pentru ziua a treia va include condițiile de pornire, istoricul anterior și cele două prognoze din ziua unu și a doua.

Acest lucru este util pentru crearea unei prognoze de ansamblu, deoarece îi puteți furniza diferite modele de zgomot ca intrare și fiecare va produce o ieșire ușor diferită de date meteo. Acest lucru servește aceluiași scop pe care îl are într-un model meteorologic tradițional: oferirea unei măsuri a incertitudinii pentru prognoză.

Pentru fiecare pătrat al rețelei, GenCast lucrează cu șase măsuri meteorologice la suprafață, împreună cu șase care urmăresc starea atmosferei și 13 altitudini diferite la care estimează presiunea aerului. Fiecare dintre aceste pătrate de grilă are 0,2 grade pe o latură, o rezoluție mai mare decât o folosește modelul european pentru prognozele sale. În ciuda acestei rezoluții, DeepMind estimează că o singură instanță (adică nu un ansamblu complet) poate fi epuizată până la 15 zile pe una dintre Sistemele de procesare a tensorului Google în doar opt minute.

Este posibil să faceți o prognoză de ansamblu rulând mai multe versiuni ale acesteia în paralel și apoi integrând rezultatele. Având în vedere cantitatea de hardware pe care Google o are la dispoziție, întregul proces de la început până la sfârșit este probabil să dureze mai puțin de 20 de minute. Sursa și datele de antrenament vor fi plasate pe pagina GitHub pentru Proiectul GraphCast al DeepMind. Având în vedere cerințele de calcul relativ scăzute, probabil că ne putem aștepta ca echipele individuale de cercetare academică să înceapă să experimenteze cu aceasta.

Măsuri ale succesului

DeepMind raportează că GenCast depășește cu mult cel mai bun model tradițional de prognoză. Folosind un standard de referință în domeniu, DeepMind a descoperit că GenCast a fost mai precis decât modelul european la 97% dintre testele pe care le-a folosit, care au verificat diferite valori de ieșire în momente diferite în viitor. În plus, valorile de încredere, bazate pe incertitudinea obținută din ansamblu, au fost în general rezonabile.

Meteorologii din trecut, care au fost instruiți pe date din lumea reală, nu sunt în general buni în a gestiona vremea extremă, deoarece apare atât de rar în setul de antrenament. Dar GenCast s-a descurcat destul de bine, depășind adesea modelul european în lucruri precum temperaturi anormal de ridicate și scăzute și presiunea aerului (frecvența de un procent sau mai puțin, inclusiv la percentila 0,01).

DeepMind a mers, de asemenea, dincolo de testele standard pentru a determina dacă GenCast ar putea fi util. Această cercetare a inclus proiectarea urmelor ciclonilor tropicali, o muncă importantă pentru modelele de prognoză. În primele patru zile, GenCast a fost semnificativ mai precis decât modelul european și și-a menținut avansul până la aproximativ o săptămână.

Unul dintre cele mai interesante teste ale DeepMind a fost verificarea prognozei globale a energiei eoliene pe baza informațiilor din Baza de date Global Powerplant. Aceasta a implicat utilizarea acestuia pentru a prognoza vitezele vântului la 10 metri deasupra suprafeței (care este de fapt mai mică decât locul în care se află majoritatea turbinelor, dar este cea mai bună aproximare posibilă) și apoi utilizarea acestui număr pentru a afla cât de multă putere ar fi generată. Sistemul a depășit modelul tradițional de vreme cu 20% în primele două zile și a rămas în frunte cu un avans în scădere până la o săptămână.

Cercetătorii nu petrec mult timp examinând de ce performanța pare să scadă treptat timp de aproximativ o săptămână. În mod ideal, mai multe detalii despre limitările GenCast ar ajuta la îmbunătățirea ulterioară, astfel încât cercetătorii se gândesc probabil la asta. În orice caz, lucrarea de astăzi marchează al doilea caz în care s-a raportat că luarea a ceva asemănător unei abordări hibride – amestecarea aspectelor sistemelor tradiționale de prognoză cu AI – a îmbunătățit prognozele. Și ambele cazuri au adoptat abordări foarte diferite, ridicând perspectiva că va fi posibilă combinarea unora dintre caracteristicile lor.

Natura, 2024. DOI: 10.1038/s41586-024-08252-9 (Despre DOI).

Chat Icon
×