Cercetătorii au construit o nouă platformă de „simulare multiversă” care poate genera cantități masive de date pentru a antrena roboți avansați de auto-învățare alimentați de inteligenţă artificială (AI).
Suita de instrumente, numită „Cosmos”, le permite cercetătorilor să creeze „modele de bază ale lumii” – rețele neuronale care simulează mediile din lumea reală și legile fizicii pentru a prezice rezultate realiste, potrivit Nvidia, care a conceput platforma. Aceste modele AI generative pot crea date sintetice pentru antrenament sisteme AI încorporate sau fizice precum vehiculele autonome (AV) sau roboții umanoizi.
Sistemele de instruire AI necesită cantități masive de date, dar oamenii de știință estimează că noi ar putea rămâne fără date disponibile public până în 2026. Sistemele AI care interacționează cu lumea reală, cum ar fi roboții, au nevoie de obicei de imagini din lumea reală, care sunt incredibil de dificil de produs și costisitor de achiziționat.
Dar crearea de date sintetice cu adevărat utile este, de asemenea, o provocare, iar un studiu a avertizat anterior acest lucru folosind date sintetice prost interpretate s-ar putea descompune în prostii de neînțeles. Cosmos este conceput pentru a rezolva aceste probleme, permițând oamenilor de știință să genereze rapid o cantitate monumentală de înregistrări video artificiale bazate pe fizica din lumea reală.
„Dezvoltatorii umanoizi de astăzi au sute de operatori umani care efectuează mii de demonstrații repetitive doar pentru a preda câteva abilități.” Pr. Lebaredianvicepreședintele Omniverse și tehnologie de simulare la Nvidia, a declarat luni (6 ianuarie) la o conferință de presă virtuală la CES 2025 din Las Vegas. „Dezvoltatorii AV de astăzi trebuie să parcurgă milioane de mile; și mai mult consumă resurse procesarea, filtrarea și etichetarea miilor de petaocteți de date capturate, iar testarea fizică este periculoasă. Dezvoltatorii de umanoizi au mult de pierdut atunci când un prototip de robot poate costa sute. de mii de dolari”.
Simularea multiversului
O componentă cheie a acestei noi platforme este simularea multivers, în care Cosmos se combină cu sistemul software Nvidia Omniverse pentru a genera fiecare rezultat posibil viitor într-un scenariu specific. Acest lucru ar fi apoi alimentat în pregătirea unui robot sau a unei mașini cu conducere autonomă.
Utilizează modele de difuzie utilizate în generarea de imagini – algoritmi de învățare automată care generează date prin adăugarea de „zgomot” (specificații granulare) la un set de date și apoi învățând să elimine zgomotul – precum și modele autoregresive, care sunt modele statistice utilizate pentru a prezice următorul pas într-un proces. Împreună, platforma poate prelua text, imagini sau videoclipuri și apoi poate genera imagini pentru a prezice în timp real ce urmează într-un anumit scenariu.
„Vine momentul ChatGPT pentru robotică. Asemenea modelelor mari de limbaj, modelele de bază ale lumii sunt fundamentale pentru dezvoltarea roboților și AV, dar nu toți dezvoltatorii au expertiza și resursele necesare pentru a le antrena pe propriile lor.” Jensen Huangfondatorul și CEO al Nvidia, a declarat într-un comunicat. „Am creat Cosmos pentru a democratiza IA fizică și a pune robotica generală la îndemâna fiecărui dezvoltator.”
Modelele de fundație mondială create folosind Cosmos sunt, de asemenea, disponibile în condiții de licență open-source.
Comentarii recente