Napjainkban óriási népszerűségnek örvendenek aktív zajszűrős fül- és fejhallgatók, amelyekkel még a nyüzsgő utcán is az otthon csendjét idéző nyugalomban élvezhetjük az éppen lejátszott zenét vagy podcasteket.
A kényelemnek ugyanakkor lehetnek hátrányai is: mi van, ha a buzgó füles olyan hangokat is kitakar, amiket az adott pillanatban tanácsosabb lenne észlelni? Erre kínál megoldást egy ígéretes új technológia, mesterséges intelligenciával adva meg a lehetőséget a kívánt zajok átengedésére.
A Tech Xplore beszámolója szerint a Paul G. Allen School of Computer Science & Engineering kutatói a San Franciscó-i UIST 2023 konferencián mutatták be az új algoritmusukat, ami a gépi tanulásra alapozva valós időben képes ki- és bekapcsolni az egyes hangok szűrését. A program ezt a fejhallgatóhoz csatlakoztatott telefonon végzi el, és összesen 20 különböző kategóriát különböztet meg a szirénáktól a babasíráson át a beszédig.
A 22 résztvevővel végzett teszt azt mutatta, hogy az eljárás irodákban, utcákon és parkokban is jól működik, az alanyok pedig úgy ítélték, hogy a rendszer által generált hangminőség átlagosan felülmúlja az eredetit.
"A kihívás az, hogy a fejhallgatót viselők által hallott hangoknak szinkronban kell lenniük a vizuális érzékszervekkel. Nem hallhatjuk valakinek a hangját két másodperccel azután, hogy beszél hozzánk. Ez azt jelenti, hogy a neurális algoritmusoknak a másodperc századrésze alatt kell feldolgozniuk a hangokat."
- illusztrálta a mesterséges intelligencia gyorsaságát a kutatás vezető szerzője, Shyam Gollakota professzor. A módosítható zajszűrésről szóló tanulmányukban ugyanakkor azt is elismerték a fejlesztők, hogy az algoritmus bizonyos esetekben nem tudta megkülönböztetni a hasonló tulajdonságokkal bíró hangokat (például az éneklést és a beszédet), amit a gépi tanuláshoz felhasznált adatmennyiség növelésével lehetne kiküszöbölni.