
Un robot umanoid care se corectează singur care a învățat faceți o ceașcă de cafea doar urmărind filmări a unui om care o face acum poate răspunde la întrebări datorită integrării cu tehnologia OpenAI.
În nou Video promotional, un tehnician îi cere figurii 01 să efectueze o serie de sarcini simple într-un mediu de testare minimalist, asemănător unei bucătărie. Mai întâi îi cere robotului ceva de mâncare și i se înmânează un măr. Apoi, i-a cerut figurii 01 să explice de ce i-a dat un măr în timp ce ridica niște gunoi. Robotul răspunde la toate întrebările cu o voce robotică, dar prietenoasă.
Legate de: Urmărește-i pe oamenii de știință controlează un robot cu mâinile în timp ce poartă Apple Vision Pro
Compania a spus în videoclipul său că conversația este alimentată de o integrare cu tehnologia realizată de OpenAI – numele din spatele ChatGPT. Cu toate acestea, este puțin probabil ca Figura 01 să folosească ChatGPT în sine, deoarece instrumentul AI nu folosește în mod normal cuvinte de pauză precum „um”, ceea ce face acest robot.
Cu OpenAI, Figura 01 poate avea acum conversații complete cu oamenii – Modelele OpenAI oferă inteligență vizuală și lingvistică de nivel înalt – Rețelele neuronale Figure oferă acțiuni robotice rapide, de nivel scăzut și priceput. Totul din acest videoclip este o rețea neuronală: pic.twitter.com /OJzMjCv44313 martie 2024
Vezi mai mult
Dacă totul din videoclip funcționează așa cum se susține, înseamnă un progres în două domenii cheie pentru robotică. După cum au spus anterior experții pentru Live Science, primul progres este ingineria mecanică din spatele mișcărilor dexteroase, auto-corecte, precum le pot face oamenii. Înseamnă motoare foarte precise, dispozitive de acționare și prindere inspirate din articulații sau mușchi, precum și controlul motorului pentru a le manipula pentru a îndeplini o sarcină și a ține obiectele cu delicatețe.
Chiar și ridicarea unei cani – ceva la care oamenii abia se gândesc în mod conștient – folosește procesarea intensivă la bord pentru a orienta mușchii într-o secvență precisă.
Al doilea progres este procesarea în timp real a limbajului natural (NLP), datorită adăugării motorului OpenAI – care trebuie să fie la fel de imediat și de receptiv ca ChatGPT atunci când introduceți o interogare în el. De asemenea, are nevoie de software pentru a traduce aceste date în audio sau vorbire. NLP este un domeniu al informaticii care își propune să ofere mașinilor capacitatea de a înțelege și de a transmite vorbirea.
Deși filmările par impresionante, până acum Livescience.com este sceptic. Ascultă la 0,52 s și din nou la 1,49 s, când Figura 01 începe o propoziție cu un „uh” rapid și repetă cuvântul „eu”, la fel ca un om care își ia o fracțiune de secundă pentru a-și înțelege gândurile pentru a vorbi. De ce (și cum) ar include un motor de vorbire AI astfel de ticuri ale dicției aleatorii, asemănătoare omului? În general, inflexiunea este, de asemenea, suspect de imperfectă, prea asemănătoare cu cadența naturală, inconștientă, pe care oamenii o folosesc în vorbire.
Bănuim că ar putea fi de fapt preînregistrat pentru a arăta la ce lucrează Figure Robotics, mai degrabă decât un test pe teren în direct, dar dacă – după cum susține subtitrarea videoclipului – totul este într-adevăr rezultatul unei rețele neuronale și arată într-adevăr Figura 01 care răspunde în realitate. timp, tocmai am făcut un alt salt uriaș către viitor.