
Oamenii de știință în China au proiectat un cip mic, modular, care este alimentat de lumină, mai degrabă decât de electricitate – și doresc să-l folosească pentru a antrena și a rula un viitor model de inteligență generală artificială (AGI).
Noul chiplet, numit „Taichi”, este o mică bucată dintr-un puzzle mai larg format din multe chipleturi individuale (inclusiv module Taichi) care, împreună, ar putea forma un sistem de calcul sofisticat și puternic. Dacă este extins suficient, acesta ar fi suficient de puternic pentru a antrena și a conduce un AGI în viitor, au argumentat oamenii de știință în lucrarea lor, publicată pe 11 aprilie în jurnal. Ştiinţă.
AGI este o formă ipotetică avansată de inteligență artificială (AI) care ar fi, teoretic, la fel de inteligentă ca și oamenii în ceea ce privește abilitățile sale de raționament cognitiv. AGI ar putea fi aplicat în multe discipline, în timp ce sistemele AI de astăzi pot fi aplicate doar foarte restrâns.
Unii experți cred că astfel de sisteme sunt la mulți ani distanțăcu un blocaj în puterea de calcul fiind un blocant cheie, în timp ce alții cred că o vom face construi un agent AGI de îndată ce 2027.
În ultimii ani, oamenii de știință au început să atingă limitările componentelor electronice convenționale, în special având în vedere creșterea AI și cantitatea mare de putere necesară pentru a deservi aceste sisteme din ce în ce mai solicitante.
Unitățile de procesare grafică (GPU) au apărut ca componente cheie în instruirea sistemelor AI, deoarece sunt mai bune la efectuarea calculelor paralele decât unitățile centrale de procesare (CPU). Dar nivelurile de consum de energie necesare devin nesustenabile pe măsură ce sistemele devin mai mari, au susținut oamenii de știință.
Componentele bazate pe lumină ar putea fi o modalitate de a depăși limitările electronicelor convenționale – inclusiv problemele de eficiență energetică.
Privind la lumină pentru IA supraomenească
Oamenii de știință au subliniat anterior designul pentru a nou tip de microcip fotonic în februarie, care folosește fotoni sau particule de lumină în loc de electroni pentru a acționa tranzistoarele – întrerupătoare electrice mici care se pornesc sau se opresc atunci când se aplică tensiune. În general, cu cât un cip are mai mulți tranzistori, cu atât are mai multă putere de calcul și cu atât are nevoie de mai multă putere pentru a funcționa. Cipurile bazate pe lumină sunt mult mai puțin consumatoare de energie și pot efectua calcule mult mai rapid decât cipurile tradiționale, deoarece pot efectua calcule în paralel.
Arhitecturile actuale de cip fotonic pentru modelele AI constau din sute sau mii de parametri sau variabile de antrenament. Acest lucru le face suficient de puternice pentru sarcini de bază, cum ar fi recunoașterea modelelor, dar modelele mari de limbaj (LLM) precum ChatGPT sunt antrenate folosind miliarde sau chiar trilioane de parametri.
Un agent AGI ar necesita probabil multe ordine de mărime mai mari – ca parte a unei rețele mai largi de arhitecturi AI. Astăzi, planurile pentru construirea unui sistem AGI nu există.
În noul studiu, oamenii de știință au proiectat Taichi să funcționeze în același mod ca alte cipuri bazate pe lumină, dar poate fi scalat mult mai bine decât modelele concurente, au spus ei în lucrarea lor. Acest lucru se datorează faptului că combină mai multe avantaje ale cipurilor fotonice existente – inclusiv „difracția optică și interferența”, care sunt modalități de manipulare a luminii din componentă.
Pentru a testa designul, cercetătorii au îmbinat mai multe cipuri Taichi și au comparat arhitectura lor cu alte cipuri bazate pe lumină în zone cheie.
Arhitectura lor a atins o scară de rețea de 13,96 milioane de neuroni artificiali – comparativ cu 1,47 milioane în următorul cel mai mare design concurent – cu o valoare a eficienței energetice de 160,82 trilioane de operațiuni pe watt (TOPS/W). Următorul cel mai bun rezultat pe care l-au evidențiat în lucrarea lor a venit cercetare publicată în 2022, în care un cip fotonic a atins 2,9 TOPS/W. Multe unități convenționale de procesare neuronală (NPU) și alte cipuri realizează cu mult sub 10 TOPS/W.
Cercetătorii au susținut, de asemenea, că arhitectura lor bazată pe Taichi este de două ori mai puternică decât alte sisteme fotonice, dar nu le-au citat în mod direct. Între timp, în teste, ei au folosit rețeaua distribuită Taichi pentru a îndeplini sarcini, inclusiv categorizarea și clasificarea imaginilor, precum și generarea de conținut de imagine, mai degrabă ca o dovadă a conceptului decât pentru a evalua performanța.
„Taichi indică potențialul mare al calculului fotonic pe cip pentru procesarea unei varietăți de sarcini complexe cu modele de rețea mari, ceea ce permite aplicații în viața reală a calculului optic”, au spus oamenii de știință. „Apreciem că Taichi va accelera dezvoltarea de soluții optice mai puternice ca suport critic pentru modelul de fundație și o nouă eră a AGI”.