Listening In On the 'Cocktail Party Effect' In the Brain
Nekateri posamezniki se lahko osredotočijo na enega samega zvočnika, kljub okolju, ki zakriva glas osebe. Prireditev je lahko učilnica, bar ali športni dogodek - sposobnost ni edinstvena in jo psihologi opisujejo kot "učinek koktajla".
Novo raziskovalno delo, ki sta ga vodila kalifornijska univerza v San Franciscu in podoktorski sodelavec, se je osredotočilo na odkrivanje delovanja selektivnega sluha v možganih.
Edward Chang, dr.med., In dr.Nima Mesgarani sta sodelovala s tremi bolniki, ki so bili na hudi operaciji možganov zaradi hude epilepsije.
Del te operacije vključuje natančno določanje delov možganov, ki so odgovorni za onemogočanje napadov. Ta vaja vključuje preslikavo možganske aktivnosti v enem tednu, s tanko plastjo do 256 elektrod, nameščenih pod lobanjo na možganski zunanji površini ali skorji. Elektrode beležijo aktivnost v temporalnem režnju - domu slušne skorje.
Chang je dejal, da je sposobnost varnega snemanja intrakranialnih posnetkov edinstvene priložnosti za napredovanje temeljnega znanja o delovanju možganov.
"Kombinacija možganskih posnetkov z visoko ločljivostjo in zmogljivih algoritmov za dekodiranje odpira okno v subjektivno izkušnjo uma, ki je še nismo videli," je dejal Chang.
V poskusih so bolniki poslušali dva vzorca govora, ki sta jima se predvajala hkrati, v katerih so različni govorci govorili različne besedne zveze. Prosili so jih, naj prepoznajo besede, ki jih je slišal izgovoriti eden od dveh govorcev.
Nato so avtorji uporabili nove metode dekodiranja, da bi "rekonstruirali" tisto, kar so subjekti slišali pri analizi njihovih vzorcev možganske aktivnosti.
Presenetljivo je, da so avtorji ugotovili, da nevronski odzivi v slušni skorji odražajo le odzive ciljnega govorca. Ugotovili so, da lahko njihov algoritem za dekodiranje na podlagi teh nevronskih vzorcev predvidi, katerega govorca in celo katere posebne besede posluša. Z drugimi besedami, lahko bi ugotovili, kdaj je pozornost poslušalca zašla k drugemu govorcu.
"Algoritem je deloval tako dobro, da smo lahko predvideli ne le pravilne odzive, ampak tudi, ko so bili pozorni na napačno besedo," je dejal Chang.
Nove ugotovitve kažejo, da zastopanost govora v skorji ne odraža le celotnega zunanjega akustičnega okolja, temveč le tisto, kar v resnici želimo ali moramo slišati.
Predstavljajo velik napredek pri razumevanju, kako človeški možgani obdelujejo jezik, kar ima takojšnje posledice za preučevanje motenj med staranjem, motenj pozornosti, avtizma in motenj učenja jezika.
Poleg tega Chang pravi, da bomo nekoč lahko uporabljali to tehnologijo za nevroprotetične pripomočke za dekodiranje namenov in misli paraliziranih bolnikov, ki ne morejo komunicirati.
Razumevanje, kako so naši možgani ožičeni tako, da dajejo prednost nekaterim slušnim znakom, kot drugi, lahko spodbudi nove pristope k avtomatizaciji in izboljšanju, kako elektronsko vmesniki z glasovnim aktiviranjem filtrirajo zvoke, da pravilno zaznajo besedne ukaze.
Metoda, s katero se možgani lahko tako učinkovito osredotočijo na en sam glas, je področje, ki zanima podjetje, ki razvija elektronske naprave z glasovno aktivnimi vmesniki.
Čeprav so tehnologije za prepoznavanje glasu, ki omogočajo takšne vmesnike, kot je Applova Siri, v zadnjih nekaj letih daleč daleč, še zdaleč niso tako dovršene kot človeški govorni sistem. Na primer, povprečna oseba lahko z relativno lahkoto vstopi v hrupno sobo in se zasebno pogovori - kot da bi bili vsi ostali glasovi v sobi utišani.
Kot je dejal Mesgarani, inženir z izkušnjami na področju raziskav samodejnega prepoznavanja govora, je prepoznavanje govora "nekaj, v čemer so ljudje izjemno dobri, vendar se izkaže, da je strojna emulacija te človeške sposobnosti izredno težka."
Raziskovalni članek je objavljen v reviji Narava.
Vir: Kalifornijska univerza, San Francisco (UCSF)