Jelentős áttörésről számolt be az emberi beszédfelismerés terén a Microsoft, a legújabb technológiája ugyanis az emberek esetében megszokott hatékonysággal képes felismerni a beszélgetéseket. Az áttörés a szavak puszta felismerése terén történt, a beszélgetés tartalmát nem képes értelmezni a szoftver.
A Microsoft szerint a szabványos Switchboard beszédfelismerési teszten 5,9 százalékos szófelismerési hibaarányt (WER, Word Error Rate) produkált a megoldása, összehasonlítási alapul az IBM rivális rendszere legutóbb 6,6 százalékos eredményt ért el. A rekord beállítása ellenére a Microsoft kutatócsapatának (nyitóképünkön) még van hova fejlesztenie a beszédfelismerőt, ugyanis a teszt "CallHome" részében 11,9 százalékos WER-t ért el. Ez a legnehezebb rész, ugyanis a szoftvernek az élőbeszéd során megszokott, nyílt végű mondatokat használó beszélgetést kell "leírnia". A fenti érték ettől függetlenül szintén rekord, de egy picivel elmarad a tipikusan 11,3 százalékos emberi hatékonyságtól.
A Microsoft beszédfelismerő rendszerének legújabb változata nem marad sokáig akadémiai jellegű érdekesség, első körben valószínűleg a Cortana hangasszisztens fog profitálni a technológiából.