Miercuri, Google DeepMind anunțat Două noi modele AI concepute pentru a controla roboții: Gemeni Robotics și Gemini Robotics-ER. Compania susține că aceste modele vor ajuta roboții de mai multe forme și dimensiuni să înțeleagă și să interacționeze cu lumea fizică mai eficient și delicat decât sistemele anterioare, deschizând calea pentru aplicații precum asistenții robot umanoizi.

Este demn de remarcat faptul că, chiar dacă hardware -ul pentru platformele robotului pare să avanseze într -un ritm constant (bine, Poate nu întotdeauna), crearea unui model AI capabil care poate pilota acești roboți în mod autonom prin scenarii noi, cu siguranță și precizie s -a dovedit evazivă. Ceea ce industria numește „AI întruchipată” este un Obiectiv Moonshot din Nvidia, de exemplu, și rămâne un graal sfânt care ar putea transforma robotica în muncitori de utilizare generală din lumea fizică.

De -a lungul acestor linii, noile modele ale Google se bazează pe Gemeni 2.0 Fundație de model de limbaj mare, adăugând capacități special pentru aplicații robotice. Gemini Robotics include ceea ce Google numește abilități de „viziune-acțiune în limbaj” (VLA), permițându-i să proceseze informațiile vizuale, să înțeleagă comenzile de limbaj și să genereze mișcări fizice. În schimb, Gemeni Robotics-ER se concentrează pe „raționamentul întruchipat” cu o înțelegere spațială sporită, permițând robotizilor să o conecteze la sistemele lor de control robot existente.

Citiți articolul complet

Comentarii

Chat Icon
×