Modelele AI mai vechi arată semne de declin cognitiv, arată studiul

Oamenii se bazează din ce în ce mai mult pe inteligenţă artificială (AI) pentru diagnostice medicale din cauza cât de rapid și eficient aceste instrumente pot observa anomalii și semne de avertizare în istoriile medicale, radiografii și alte seturi de date înainte de a deveni evidente pentru ochiul liber. Dar un nou studiu publicat la 20 decembrie 2024 în BMJ ridică îngrijorarea că tehnologiile AI precum modelele de limbaj mare (LLM) și chatbot -urile, precum oamenii, prezintă semne ale abilităților cognitive deteriorate cu vârsta.

„Aceste descoperiri contestă presupunerea că inteligența artificială va înlocui în curând medicii umani”, au scris autorii studiului în lucrare, „întrucât deficiența cognitivă evidentă în chatbot -urile de frunte pot afecta fiabilitatea lor în diagnosticul medical și subminează încrederea pacienților”.

Oamenii de știință au testat chatbot-uri bazate pe LLM disponibil public, inclusiv Chatgpt-ul lui OpenAI, Sonetul Anthropic și Gemini alfabet folosind Evaluarea cognitivă de la Montreal (MOCA) Test – O serie de sarcini pe care le folosesc neurologii pentru a testa abilitățile în atenție, memorie, limbaj, abilități spațiale și funcție mentală executivă.

MOCA este cel mai frecvent utilizat pentru a evalua sau testa pentru debutul deficienței cognitive în condiții precum boala Alzheimer sau demența. Subiecților li se oferă sarcini, cum ar fi desenarea unui timp specific pe o față de ceas, începând de la 100 și scăzând în mod repetat șapte, amintindu -și cât mai multe cuvinte dintr -o listă vorbită și așa mai departe. La om, 26 din 30 este considerat un scor de trecere (adică subiectul nu are deficiență cognitivă.

Înrudite: ChatGPT este cu adevărat îngrozitor la diagnosticarea afecțiunilor medicale

În timp ce unele aspecte ale testării precum denumirea, atenția, limbajul și abstracția au fost aparent ușoare pentru majoritatea LLM -urilor utilizate, toate s -au comportat slab în abilități vizuale/spațiale și sarcini executive, cu mai mulți făcând mai rău decât altele în domenii precum rechemarea întârziată.

În mod crucial, în timp ce cea mai recentă versiune a ChatGPT (versiunea 4) a marcat cea mai mare (26 din 30), cea mai veche Gemini 1.0 LLM a marcat doar 16 – ceea ce a dus la concluzia LLM -urilor mai vechi prezintă semne de declin cognitiv.

Obțineți cele mai fascinante descoperiri din lume livrate direct în căsuța de e -mail.

Autorii studiului notează că concluziile lor sunt doar observaționale – diferențe critice între modurile în care AI și munca minții umane înseamnă că experimentul nu poate constitui o comparație directă. Dar ei avertizează că ar putea indica ceea ce ei numesc o „zonă semnificativă de slăbiciune” care ar putea pune frânele pe desfășurarea AI în medicina clinică. Mai exact, ei au argumentat împotriva utilizării AI în sarcini care necesită abstractizare vizuală și funcție executivă.

De asemenea, crește noțiunea oarecum amuzantă de neurologi umani care preiau o piață cu totul nouă – AIS înșiși care prezintă semne de deficiență cognitivă.

Modelele AI mai vechi arată semne de declin cognitiv, arată studiul

Leave a Comment Cancel