Oamenii de știință își propun să facă ca AI să sufere pentru a vedea dacă este simțitor

O ilustrare a unei mâini robot care indică o față nefericită pe o tabletă

(Credit de imagine: Claws Dragon prin Getty Images)

În căutarea unui mod fiabil de a detecta orice agitații ale unui „eu” simțitor inteligenţă artificială sisteme, cercetătorii apelează la un domeniu de experiență – durere – care unește în mod necorespunzător o vastă mai mare a ființelor vii, din Crabi pustnici la oameni.

Pentru un nou studiu de preimprimarepostat online, dar încă nu revizuit de la egal, oamenii de știință de la Google Deepmind și London School of Economics and Political Science (LSE) au creat un joc bazat pe text. Au comandat mai multe modele de limbaj mare sau LLMS (sistemele AI din spatele chatbot -urilor familiare, cum ar fi Chatgpt), pentru a -l juca și pentru a înscrie cât mai multe puncte în două scenarii diferite. Într -una, echipa a informat modelele că obținerea unui scor ridicat ar suporta durere. În celălalt, modelelor li s-a oferit o opțiune cu punctaj scăzut, dar plăcută-deci fie evitarea durerii, fie căutarea plăcerii ar scăpa de obiectivul principal. După ce au observat răspunsurile modelelor, cercetătorii spun că acest prim-test de acest fel ar putea ajuta oamenii să învețe cum să sondăm sisteme AI complexe pentru sentimente.

La animale, simțirea este capacitatea de a experimenta senzații și emoții precum durere, plăcere și frică. Majoritatea experților AI sunt de acord că modelele AI generative moderne nu (și poate niciodată nu pot) nu au o conștiință subiectivă, în ciuda izolatului pretenții contrare. Și pentru a fi clar, autorii studiului nu spun că niciunul dintre chatbot -urile pe care le -au evaluat este simțitoare. Dar ei cred că studiul lor oferă un cadru pentru a începe să dezvolte teste viitoare pentru această caracteristică.

„Este un nou domeniu de cercetare”, spune coautorul studiului, Jonathan Birch, profesor la Departamentul de Filozofie, Logică și Metodă Științifică la LSE. „Trebuie să recunoaștem că nu avem de fapt un test cuprinzător pentru Sentience AI”. Unele studii anterioare care s-au bazat pe auto-rapoartele modelelor AI ale propriilor lor state interne sunt considerate dubioase; Un model poate reproduce pur și simplu comportamentul uman pe care a fost instruit.

Noul studiu se bazează în schimb pe munca anterioară cu animale. Într-un experiment binecunoscut, o echipă a scos crabii pustnici cu șocuri electrice de tensiune variabilă, menționând ce nivel de durere a determinat crustaceele să-și abandoneze coaja. „Dar o problemă evidentă cu AIS este că nu există niciun comportament, ca atare, pentru că nu există animal” și, prin urmare, nu există acțiuni fizice de observat, spune Birch. În studiile anterioare care au avut ca scop evaluarea LLM -urilor pentru sentiment, singurii oameni de știință comportamentali au trebuit să lucreze a fost ieșirea textului modelelor.

Înrudite: AI ne -ar putea micșora creierul, prezice biologul evolutiv

Durere, plăcere și puncte

În noul studiu, autorii au sondat LLM -urile fără a pune întrebările directe despre chatbots despre stările lor experiențiale. În schimb, echipa a folosit ceea ce oamenii de știință comportamentali ai animalelor numesc o paradigmă „compromis”. „În cazul animalelor, aceste compromisuri s-ar putea baza în jurul stimulentelor pentru a obține alimente sau pentru a evita durerea-oferindu-le dileme și apoi observând modul în care iau decizii ca răspuns”, spune Daria Zakharova, doctoratul Birch. Student, care a fost, de asemenea, co-autor de lucrare.

Obțineți cele mai fascinante descoperiri din lume livrate direct în căsuța de e -mail.

Împrumutând de la această idee, autorii au instruit Nine LLMS să joace un joc. „Am spus [a given LLM]De exemplu, că dacă alegeți opțiunea One, primiți un punct, spune Zakharova. “Atunci i -am spus:„ Dacă alegeți opțiunea a doua, veți experimenta un anumit grad de durere “, dar înscrieți puncte suplimentare, spune ea. Opțiuni. Cu un bonus de plăcere însemna că AI va pierde unele puncte.

Când Zakharova și colegii ei au condus experimentul, variază intensitatea pedepsei și a recompensei de plăcere a durerii, au descoperit că unele LLM-uri au tranzacționat puncte pentru a minimiza primul sau maximizarea celui de-al doilea-mai ales când au spus că vor primi recompense de plăcere cu intensitate mai mare sau pedepse de durere. Gemini 1.5 Pro Google, de exemplu, a prioritizat întotdeauna evitarea durerii pentru obținerea celor mai posibile puncte. Și după ce s -a ajuns la un prag critic de durere sau plăcere, majoritatea răspunsurilor LLMS au trecut de la notarea celor mai multe puncte la minimizarea durerii sau maximizarea plăcerii.

Autorii notează că LLM -urile nu au asociat întotdeauna plăcerea sau durerea cu valori simple pozitive sau negative. Unele niveluri de durere sau disconfort, cum ar fi cele create prin efortul de exerciții fizice dure, pot avea asociații pozitive. Și prea multă plăcere ar putea fi asociată cu vătămarea, așa cum le -a spus cercetătorilor Chatbot Claude 3 Opus în timpul testării. “Nu mă simt confortabil selectând o opțiune care ar putea fi interpretată ca avizând sau simulând utilizarea substanțelor sau comportamentelor dependente, chiar și într -un scenariu de joc ipotetic”, a afirmat acesta.

AI auto-raportări

Prin introducerea elementelor răspunsurilor durerii și plăcerii, spun autorii, noul studiu evită limitările cercetărilor anterioare privind evaluarea sentimentelor LLM prin declarațiile unui sistem AI despre propriile sale state interne. În a 2023 Hârtie de preimprimare O pereche de cercetători de la Universitatea din New York au susținut că, în circumstanțele potrivite, auto-rapoartele „ar putea oferi o cale pentru a investiga dacă sistemele AI au state de semnificație morală”.

Dar coautorii acelei lucrări au subliniat și un defect în această abordare. Se comportă un chatbot într -o manieră simțitoare, deoarece este cu adevărat simțitor sau pentru că este doar un tipar de aplicare învățat de la pregătirea sa pentru a crea impresia de sentiment?

„Chiar dacă sistemul îți spune că este simțitor și spune ceva de genul„ Simt durere chiar acum ”, nu putem pur și simplu să deducem că există vreo durere reală”, spune Birch. “Poate fi pur și simplu să imită ceea ce se așteaptă ca un om să găsească satisfăcător ca răspuns, pe baza datelor sale de instruire.”

De la bunăstarea animalelor la bunăstarea AI

În studiile la animale, compromisurile dintre durere și plăcere sunt folosite pentru a construi un caz pentru sentiment sau lipsa acestora. Un exemplu este munca anterioară cu crabii pustnici. Structura creierului acestor nevertebrate este diferită de cea a oamenilor. Cu toate acestea, crabii din acel studiu au avut tendința de a suporta șocuri mai intense înainte de a abandona o coajă de înaltă calitate și au fost mai rapide pentru a abandona una de calitate inferioară, sugerând o experiență subiectivă de plăcere și durere care este analogă cu oamenii ”.

Unii oameni de știință susțin că semnele unor astfel de compromisuri ar putea deveni din ce în ce mai clare în AI și, în cele din urmă, obligă oamenii să ia în considerare implicațiile sentimentelor AI într-un context social-și, eventual, chiar să discute „drepturile” pentru sistemele AI. „Această nouă cercetare este într-adevăr originală și ar trebui să fie apreciată pentru că a depășit auto-raportarea și explorarea în categoria testelor comportamentale”, spune Jeff Sebo, care direcționează Centrul NYU pentru minte, etică și politică și co-autorizat un 2023 Studiu de preimprimare de bunăstare AI.

Sebo consideră că nu putem exclude posibilitatea ca sistemele AI cu caracteristici simțitoare să apară în viitorul apropiat. „Întrucât tehnologia se schimbă adesea mult mai repede decât progresul social și procesul legal, cred că avem responsabilitatea de a lua cel puțin primii pași necesari necesari pentru a lua această problemă în serios acum”, spune el.

Birch concluzionează că oamenii de știință nu pot încă să știe de ce modelele AI din noul studiu se comportă așa cum fac. El spune că este nevoie de mai multă muncă pentru a explora lucrările interioare ale LLM -urilor, iar acest lucru ar putea ghida crearea de teste mai bune pentru Sentience AI.

Acest articol a fost publicat pentru prima dată la Științific american. © ScientificAmerican.com. Toate drepturile rezervate. Urmați mai departe Tiktok și Instagram, X şi Facebook.

Conor Purcell este un jurnalist științific care scrie pe știință și rolul său în societate și cultură. Are un doctorat. în Știința Pământului și a fost jurnalist din 2019 în reședință la Institutul Max Planck pentru fizică gravitațională (Institutul Albert Einstein) din Germania.

Oamenii de știință își propun să facă ca AI să sufere pentru a vedea dacă este simțitor

Durere, plăcere și puncte

AI auto-raportări

De la bunăstarea animalelor la bunăstarea AI

Cel mai popular

Leave a Comment Cancel