Dacă AI face ca testul Turing să fie depășit, ce ar putea fi mai bun?

Un android alb așezat la o masă într-un mod deprimat cu o băutură alcoolică. Redare 3D de foarte înaltă rezoluție.

Dacă o mașină sau un program AI se potrivește sau depășește inteligența umană, înseamnă asta că poate simula oamenii perfect? Dacă da, atunci cum rămâne cu raționamentul – capacitatea noastră de a aplica logica și de a gândi rațional înainte de a lua decizii? Cum am putea chiar să identificăm dacă un program AI poate raționa? Pentru a încerca să răspundă la această întrebare, o echipă de cercetători a propus un cadru nou care funcționează ca un studiu psihologic pentru software.

„Acest test tratează un program „inteligent” ca și cum ar fi un participant la un studiu psihologic și are trei pași: (a) testează programul într-un set de experimente care examinează inferențe, (b) testează înțelegerea propriului mod de a raționament și (c) să examineze, dacă este posibil, adecvarea cognitivă a codului sursă pentru program”, au spus cercetătorii. Notă.

Ei sugerează metodele standard de evaluare a inteligenței unei mașini, cum ar fi Testul Turingvă poate spune doar dacă aparatul este bun la procesarea informațiilor și mimând uman răspunsuri. Generațiile actuale de programe AI, cum ar fi LaMDA de la Google și ChatGPT de la OpenAI, de exemplu, au ajuns aproape de trecere Testul Turing, dar rezultatele testelor nu sugerează că aceste programe pot gândi și raționa ca oamenii.

Acesta este motivul pentru care testul Turing ar putea să nu mai fie relevant și este nevoie de noi metode de evaluare care ar putea evalua în mod eficient inteligența mașinilor, potrivit cercetătorilor. Ei susțin că cadrul lor ar putea fi o alternativă la testul Turing. „Ne propunem să înlocuim testul Turing cu unul mai concentrat și mai fundamental pentru a răspunde la întrebarea: raționează programele în modul în care raționează oamenii?” autorii studiului argumentează.

Ce este în neregulă cu testul Turing?

În timpul testului Turing, evaluatorii joacă diferite jocuri care implică comunicații bazate pe text cu oameni reali și programe AI (mașini sau chatbots). Este un test orb, așa că evaluatorii nu știu dacă trimit mesaje cu un om sau un chatbot. Dacă programele de IA reușesc să genereze răspunsuri asemănătoare oamenilor – în măsura în care evaluatorii se luptă să facă distincția între programul uman și programul de IA – se consideră că IA a trecut. Cu toate acestea, deoarece testul Turing se bazează pe interpretare subiectivă, acestea rezultatele sunt de asemenea subiective.

Cercetătorii sugerează că există mai multe limitări asociate testului Turing. De exemplu, oricare dintre jocurile jucate în timpul testului sunt jocuri de imitație concepute pentru a testa dacă o mașină poate sau nu imita un om. Evaluatorii iau decizii exclusiv pe baza limbajului sau a tonului mesajelor pe care le primesc. ChatGPT este grozav la mimare limbajul uman, chiar și în răspunsurile în care oferă informații incorecte. Deci, testul în mod clar nu evaluează raționamentul și capacitatea logică a unei mașini.

De asemenea, rezultatele testului Turing nu vă pot spune dacă o mașină poate introspecta. Ne gândim adesea la acțiunile noastre trecute și reflectăm asupra vieților și deciziilor noastre, a capacitate critică care ne împiedică să repetăm aceleași greșeli. Același lucru este valabil și pentru AI, conform a studiu de la Universitatea Stanford, care sugerează că mașinile care s-ar putea auto-reflectare sunt mai practice pentru uz uman.

„Agenții AI care pot valorifica experiența anterioară și se pot adapta bine prin explorarea eficientă a unor medii noi sau în schimbare vor duce la tehnologii mult mai adaptabile și flexibile, de la robotică casnică la instrumente de învățare personalizate”, Nick Haber, profesor asistent de la Universitatea Stanford, care nu a fost implicat. în studiul actual, a spus.

În plus, testul Turing nu reușește să analizeze capacitatea de gândire a unui program AI. Într-un experiment recent al testului Turing, GPT-4 a reușit să-i convingă pe evaluatori că trimiteau mesaje text cu oameni. peste 40 la sută a timpului. Cu toate acestea, acest scor nu reușește să răspundă la întrebarea de bază: poate gândi programul AI?

Alan Turingcelebrul om de știință britanic care a creat testul Turing, odată a spus, „Un computer ar merita să fie numit inteligent dacă ar putea înșela un om să creadă că este om.” Testul său acoperă însă doar un aspect al inteligenței umane: imitația. Deși este posibil să înșeli pe cineva folosind acest aspect, mulți experți cred că o mașină nu poate realiza niciodată adevărata inteligență umană fără a include acele alte aspecte.

„Nu este clar dacă promovarea testului Turing este o etapă semnificativă sau nu. Nu ne spune nimic despre ceea ce poate face sau înțelege un sistem, nimic despre faptul dacă a stabilit monologuri interioare complexe sau se poate angaja în planificare pe orizonturi de timp abstracte, ceea ce este cheia inteligenței umane”, Mustafa Suleyman, expert în inteligență artificială și fondatorul DeepAI, spuse Bloomberg.

Dacă AI face ca testul Turing să fie depășit, ce ar putea fi mai bun?

Ce este în neregulă cu testul Turing?

Leave a Comment Cancel