
O nouă versiune de ChatGPT poate citi expresiile faciale, imita modelele vocii umane și poate avea conversații aproape în timp real, au dezvăluit creatorii săi.
OpenAI a demonstrat viitoarea versiune a inteligență artificială (AI) chatbot, numit GPT-4o, într-o prezentare aparent în timp real de luni (13 mai). Chatbot-ul, care a vorbit cu voce tare cu prezentatorii printr-un telefon, părea să aibă o comandă ciudată a conversației umane și a indiciilor sale emoționale subtile – comutând între vocile robotizate și cântătoare la comandă, adaptându-se la întreruperi și procesând vizual expresiile faciale și împrejurimile sale. parteneri de conversație.
În timpul demonstrației, asistentul vocal AI și-a demonstrat abilitățile realizând sarcini precum traducerea limbii în timp real, rezolvarea unei ecuații matematice scrise pe o bucată de hârtie și îndrumând o persoană nevăzătoare pe străzile Londrei.
„ea”, a scris Sam Altman, CEO-ul OpenAI, într-un singur cuvânt post pe platforma de socializare X după terminarea prezentării. Postarea este o referire la filmul din 2013 cu același nume, în care un bărbat singuratic se îndrăgostește de un asistent AI.
Pentru a-și arăta capacitatea de a citi indicii vizuale, chatbot-ul a folosit obiectivul camerei telefonului pentru a citi expresiile faciale ale unui inginer OpenAI și pentru a-i descrie emoțiile.
„Ah, iată, se pare că te simți destul de fericit și vesel cu un zâmbet larg și o notă de emoție”, a spus botul, care a răspuns la numele ChatGPT. “Orice s-ar întâmpla, se pare că ești într-o dispoziție bună. Vrei să împărtășești sursa acelor vibrații bune?”
Dacă demonstrația este o reprezentare exactă a abilităților botului, noile capabilități reprezintă o îmbunătățire masivă a caracteristicilor vocale limitate din modelele anterioare ale companiei – care nu erau capabile să gestioneze întreruperile sau să răspundă la informațiile vizuale.
„Ne uităm la viitorul interacțiunii dintre noi și mașini”, Mira Murati, a declarat directorul de tehnologie al OpenAI la conferința de presă. „Credem că GPT-4o schimbă cu adevărat această paradigmă”.
Noul asistent vocal este programat să fie lansat într-o formă limitată pentru testerii alfa în săptămânile următoare, urmat de o lansare mai largă, care va începe cu plata abonaților ChatGPT Plus. Anunțul vine și după un Bloomberg raport că compania se apropie de un acord cu Apple pentru a integra ChatGPT pe iPhone – deschizând posibilitatea ca GPT-4o să fie folosit pentru a face upgrade Siri, asistentul vocal al iPhone.
Dar noua tehnologie vine cu probleme semnificative de siguranță. Capacitatea botului de a procesa text în timp real, input audio și vizual înseamnă că ar putea fi folosit pentru spionaj. Iar mimica sa emoțională convingătoare l-ar putea face, de asemenea, expert în a efectua apeluri telefonice înșelătorie sau a prezenta dezinformații periculoase într-o manieră convingătoare.
Ca răspuns la aceste probleme, Murati a spus că OpenAI lucrează pentru a construi „atenuări împotriva utilizării greșite” a noii tehnologii.