Folosind inteligenţă artificială (AI), oamenii de știință au dezvăluit activitatea creierului complexă care se desfășoară în timpul conversațiilor de zi cu zi.
Instrumentul ar putea oferi noi perspective asupra neuroștiinței limbajului, iar într -o zi, ar putea ajuta la îmbunătățirea tehnologiilor concepute pentru a recunoaște vorbirea sau Ajutați oamenii să comunicespun cercetătorii.
Pe baza modului în care un model AI transcrie audio în text, cercetătorii din spatele studiului ar putea mapa activitatea creierului care are loc în timpul conversației mai exact decât modelele tradiționale care codifică caracteristici specifice ale structurii limbajului – cum ar fi fonemele (sunetele simple care alcătuiesc cuvinte) și părți ale vorbirii (cum ar fi substantive, verbe și adjective).
Modelul utilizat în studiu, numit Whisperîn schimb, preia fișierele audio și transcrierile lor de text, care sunt utilizate ca date de instruire pentru a cartografia audio în text. Apoi folosește statisticile acelui mapare pentru a „învăța” pentru a prezice textul din fișiere audio noi pe care nu le -a auzit anterior.
Înrudite: Limba ta maternă poate modela cablarea creierului tău
Ca atare, Whisper funcționează pur și simplu prin aceste statistici, fără caracteristici ale structurii limbajului codificate în setările sale originale. Cu toate acestea, în studiu, oamenii de știință au arătat că acele structuri au apărut încă în model odată ce au fost instruite.
Studiul aruncă lumină asupra modului în care aceste tipuri de modele AI – numite modele de limbă mare (LLM) – funcționează. Dar echipa de cercetare este mai interesată de perspectiva pe care o oferă în limbajul uman și cogniția. Identificarea asemănărilor dintre modul în care modelul dezvoltă abilități de procesare a limbajului și modul în care oamenii dezvoltă aceste abilități poate fi utilă pentru dispozitivele de inginerie care ajută oamenii să comunice.
„Este cu adevărat despre cum ne gândim la cogniție”, a spus autorul studiului principal Ariel Goldsteinprofesor asistent la Universitatea ebraică din Ierusalim. Rezultatele studiului sugerează că „ar trebui să ne gândim la cogniție prin obiectivul acestui lucru [statistical] Tipul modelului „, a spus Goldstein Live Science.
Despachetarea cunoașterii
Studiul, publicat pe 7 martie în jurnal Comportamentul uman al naturiia prezentat patru participanți cu epilepsie care au fost deja în curs de o intervenție chirurgicală pentru a avea electrozi de monitorizare a creierului implantat din motive clinice.
Cu consimțământul, cercetătorii au înregistrat toate conversațiile pacienților de -a lungul șederii lor în spital, care au variat de la câteva zile la o săptămână. Au capturat în total peste 100 de ore de audio.
Fiecare dintre participanți a instalat 104 până la 255 de electrozi pentru a -și monitoriza activitatea creierului.
Majoritatea studiilor care folosesc înregistrări ale conversațiilor au loc într -un laborator în circumstanțe foarte controlate peste aproximativ o oră, a spus Goldstein. Deși acest mediu controlat poate fi util pentru a elimina rolurile diferitelor variabile, Goldstein și colaboratorii săi au dorit să „exploreze activitatea creierului și comportamentul uman în viața reală”.
Studiul lor a relevat modul în care diferite părți ale creierului se angajează în timpul sarcinilor necesare pentru a produce și înțelege vorbirea.
Goldstein a explicat că există o dezbatere continuă cu privire la faptul că părți distincte ale creierului se lovesc de unelte în timpul acestor sarcini sau dacă întregul organ răspunde mai colectiv. Prima idee ar putea sugera că o parte a creierului procesează sunetele reale care alcătuiesc cuvinte, în timp ce altul interpretează semnificațiile acelor cuvinte și încă o altă gestionează mișcările necesare pentru a vorbi.
În teoria alternativă, este mai mult ca aceste regiuni diferite ale creierului să funcționeze în concert, luând o abordare „distribuită”, a spus Goldstein.
Cercetătorii au descoperit că anumite regiuni ale creierului tindeau să se coreleze cu unele sarcini.
De exemplu, zonele cunoscute a fi implicate în procesarea sunetului, cum ar fi girul temporal superior, au arătat mai multă activitate atunci când gestionarea informațiilor auditive și zonele implicate în gândirea la nivel superior, cum ar fi gyrusul frontal inferior, au fost mai active pentru înțelegerea sensului limbajului.
De asemenea, au putut vedea că zonele au devenit active secvențial.
De exemplu, regiunea cea mai responsabilă de auzirea cuvintelor a fost activată în fața regiunii cele mai responsabile de interpretarea acestora. Cu toate acestea, cercetătorii au văzut clar că zonele activate în timpul activităților pentru care nu se știe că sunt specializate.
„Cred că este cea mai cuprinzătoare și minuțioasă, dovezi din viața reală pentru această abordare distribuită”, a spus Goldstein.
Legarea modelelor AI de lucrările interioare ale creierului
Cercetătorii au folosit 80% din audio audio și transcrieri însoțitoare pentru a antrena șoaptă, astfel încât să poată prezice transcrierile pentru restul de 20% din audio.
Echipa a analizat apoi modul în care audio și transcrierile au fost capturate de Whisper și a mapat acele reprezentări la activitatea creierului capturată cu electrozii.
După această analiză, ei ar putea folosi modelul pentru a prezice ce activitate cerebrală va merge cu conversații care nu au fost incluse în datele de instruire. Precizia modelului a depășit -o pe cea a unui model bazat pe caracteristicile structurii limbajului.
Deși cercetătorii nu au programat ceea ce un fonem sau un cuvânt este în modelul lor de la început, au descoperit că acele structuri de limbaj erau încă reflectate în modul în care modelul și -a rezolvat transcrierile. Așa că a extras acele caracteristici fără a fi îndrumat să facă acest lucru.
Cercetarea este un „studiu de ultimă generație, deoarece demonstrează o legătură între funcționarea unui model de calcul acustic-la-speech-to-limbaj și funcție creier”, ” Leonhard Schilbachun lider al grupului de cercetare la Centrul de Neuroștiințe din Munchen din Germania, care nu a fost implicat în lucrare, a declarat Live Science într -un e -mail.
Cu toate acestea, el a adăugat că, „este nevoie de mult mai multe cercetări pentru a investiga dacă această relație implică într -adevăr asemănări în mecanismele prin care modelele de limbă și limbajul procesului creierului”.
„Compararea creierului cu rețelele neuronale artificiale este o linie importantă de muncă”, a spus Gašper Begušprofesor asociat la Departamentul de Lingvistică de la Universitatea din California, Berkeley, care nu a fost implicat în studiu.
„Dacă înțelegem funcționarea interioară a neuronilor artificiali și biologici și a asemănărilor acestora, am putea fi capabili să efectuăm experimente și simulări care ar fi imposibil de condus în creierul nostru biologic”, a spus el pentru Live Science prin e -mail.
Comentarii recente