Az emberi beszéd felismerése és helyes reprodukciója a nyelvtechnológiai kutatások és fejlesztések talán legizgalmasabb területe. Ritkán gondolunk bele, hogy a beszéd, amelyet alapvető képességünknek tartunk, sajnos nem adott minden ember számára. Gondoljunk csak a híres elméleti fizikusra, Stephen Hawkingra, aki súlyos betegségének következtében egy módosított Apple II számítógép segítségével tudott beszélni, de eszünkbe juthat Jean-Dominique Bauby is, a Szkafander és pillangó című memoár szerzője, aki egy agyvérzés következtében teljesen lebénult és beszédképtelenné vált, csupán bal szemhéjának mozgatásával volt képes kommunikálni a külvilággal.
Az idegtudománynak és a nyelvtechnológiai fejlesztéseknek köszönhetően azonban jelentős előrelépések történtek abban, hogy a különböző beszédzavarokban szenvedők élete könnyebbé váljon. Az egyik legutóbbi fejlemény a San Franciscó-i Kalifornia Egyetem négy kutatójához fűződik; egy mesterséges intelligencián alapuló program elkészítésén fáradoznak, amely agyhullámokból képez írott szöveget.
Eddigi eredményeikről a neves Nature magazin idegtudományokkal foglalkozó lapjában tettek közzé egy tanulmányt, amelyben bemutatták folyamat sajátosságait: a gépi fordítóeszközök és programok algoritmikus megoldásait vették alapul ahhoz az eljáráshoz, amely keretein belül az emberi agy neurális aktivitásait hangzó beszédre fordítja egy mesterséges intelligencián alapuló program.
A kutatók által felvetett módszer azonban egy jelentős nehézséggel is bír, hiszen a hagyományos fordítóprogramok esetében a bemenet és a kimenet egyaránt szöveges formában történik, a tanulmányban taglalt eljárásnál viszont csupán az agyi aktivitás idegi jeleire alapozhatnak. A kutatók természetesen kísérleteket is folytattak, hogy teszteljék hipotézisüket. Négy, epilepsziában szenvedő önkéntes agyába elektródákat ültettek, amely eljárás után egyrészt monitorozták beszédüket, majd előre összeállított adatbázisokból készített mondatokat olvastattak velük. Mindegyik résztvevő 50 mondatot olvasott fel, közben pedig a kutatók folyamatosan monitorozták az artikuláció közben tapasztalható agyi aktivitást.
Az így kialakult adathalmazt és mintázatokat átültették egy gépi tanulóprogramba, amely az agyhullámok jeleit jól formált emberi mondatokra próbálta fordítani. A folyamat nem volt éppen zökkenőmentes; a gép által artikulált mondatok között voltak nyelvi szempontból teljesen értelmetlenek és az eredeti próbálkozásoktól viszonylag távoli megoldások, idővel viszont egyre szofisztikáltabbá vált a rendszer.
Egy esetben például a reprodukció meghaladta a 97%-os pontosságot, ami alacsonyabb hibamennyiséget jelent, mint amennyit egy átlagos emberi átíró vét ilyen esetekben.
Fontos azonban megjegyezni, hogy ezek a sikerek még nagyon kezdetiek, és hosszú munka van még hátra ahhoz, hogy ez a megoldás széles körben is hatékony legyen, ugyanis az algoritmus mondat- és szótára egyelőre érthető okokból jóval csekélyebb, mint amit egy átlagos felhasználó igényelne a maradéktalan kommunikációhoz. További leküzdendő akadály az is, hogy a rendszer kizárólag verbális jeleken alapul, tehát azoknak, akik izombénulás okozta beszédzavarban szenvednek, egyelőre nem nyújt segítséget ez a megoldás.