
Căștile cu anulare a zgomotului sunt larg răspândite în zilele noastre, dar oamenii de știință au găsit o modalitate de a duce aceste dispozitive la următorul nivel – prin crearea de căști care se pot concentra pe o sursă externă de sunet și pot bloca toate celelalte zgomote.
Tehnologia, numită „Target Speech Hearing”, folosește inteligenţă artificială (AI) pentru a-l lăsa pe purtător să se confrunte cu un difuzor din apropiere și, după o întârziere de câteva secunde, să-și blocheze vocea. Acest lucru permite utilizatorului să audă doar acea sursă audio specifică, reținând semnalul chiar dacă difuzorul se mișcă sau se întoarce.
Tehnologia cuprinde un computer mic care poate fi încorporat într-o pereche de căști comerciale, de la raft, folosind semnale de la microfonul încorporat al căștilor pentru a selecta și identifica vocea unui difuzor. Oamenii de știință au subliniat detaliile într-o lucrare publicată pe 11 mai în jurnalul Proceedings of the CHI Conference on Human Factors in Computing Systems.
Oamenii de știință speră că tehnologia ar putea fi folosită ca ajutoare pentru persoanele cu deficiențe de auz și lucrează pentru a integra sistemul în căștile comerciale și protezele auditive.
„Acum tindem să ne gândim la AI ca la chatbot-uri bazate pe web care răspund la întrebări”, a spus autorul principal al studiului. Shyam Gollakota, profesor de Informatică și Inginerie la Universitatea din Washington. „În acest proiect, dezvoltăm AI pentru a modifica percepția auditivă a oricui poartă căști, având în vedere preferințele lor. Cu dispozitivele noastre, acum puteți auzi clar un singur difuzor chiar dacă vă aflați într-un mediu zgomotos, cu o mulțime de oameni care vorbesc”, Gollakota. a spus într-o declarație.
Target Speech Hearing (TSH) urmează cercetărilor efectuate de aceiași oameni de știință în „auzul semantic„ anul trecut. În acel proiect, au creat o aplicație pentru smartphone alimentată de inteligență artificială care ar putea fi asociată cu căști, care îi permite purtătorului să aleagă să audă dintr-o listă de „clase” prestabilite în timp ce anulează toate celelalte zgomote. De exemplu, un purtător ar putea alege să audă sirene, bebeluși, vorbire sau păsări – iar căștile ar evidenția doar acele zgomote și le-ar bloca pe toate celelalte.
Pentru a utiliza TSH, purtătorul se confruntă direct în fața difuzorului a cărui voce dorește să o audă, înainte de a apăsa un mic buton de pe căști pentru a activa sistemul atunci când este poziționat corect.
Când vocea vorbitorului ajunge la microfon, software-ul de învățare automată „înregistrează” sursa audio. Permite o mică marjă de eroare – în cazul în care ascultătorul nu este direct perpendicular pe difuzor – înainte de a identifica vocea țintă și de a înregistra modele vocale. Acest lucru îi permite să se blocheze pe difuzor, indiferent de volum sau de direcția în care se află.
Pe măsură ce difuzorul continuă să vorbească, îmbunătățește capacitatea sistemului de a se concentra asupra sunetului, deoarece algoritmul identifică mai bine modelele unice ale sunetului țintă în timp.
Deocamdată, TSH poate înregistra doar o singură sursă audio sau un singur difuzor la un moment dat și are mai puțin succes dacă există un alt zgomot cu un volum similar care vine din aceeași direcție.
Într-o lume ideală, oamenii de știință ar prezenta sistemul cu o probă audio „curată” pentru a identifica și înrola, fără alt zgomot de mediu care ar putea interfera cu procesul, spun ei în lucrare. Dar acest lucru nu ar fi bine aliniat cu construirea unui dispozitiv practic, deoarece obținerea unui sunet clar este o provocare în scenariile din lumea reală.