Jó néhány éve dolgoznak a gépi fordítás problémáján különféle cégek és kutatóintézetek. Egyelőre a dolog nem problémamentes még akkor sem, ha csak begépelt szöveg fordításáról van szó, hát még ha élő beszédet szeretnénk tolmácsoltatni.
A Microsoft Research most kihasználta a TechFest 2012 rendezvény adta nyilvánosságot, hogy újra bedobja a köztudatba az élőszó fordításának kérdését. A Microsoft Research szoftvere beszámolók szerint egy lépcsőfokkal előbbre jár, mint az eddigi próbálkozások, saját nyelvünkön beszélhetünk a programhoz, mely a hangszórókon keresztül már a célnyelvre fordítva szólal meg. A Monolingual TTS megnevezésre hallgató program repertoárjában jelenleg 26 nyelv található meg. (Persze senki ne gondoljon a magyar használatára, egzotikus és viszonylag kevesek által ismert anyanyelvünk jobbára csúnyán elvérezteti a a latin-germán lingvisztikán nevelkedett gépelt szöveges fordítóprogramokat.)
A Microsoft megoldásának egyik különlegessége, hogy a kimeneten hallható beszédhang nem a szokásos recsegős stílusú gépi irányvonalat képviseli, hanem hangszínében emlékeztet az eredeti beszélő hangjára. Mi több, a szoftver a felhasználó 3D-s képét is megjeleníti, mintha az valóban beszélne. A gyártó a nem verbális kommunikációs elemeket is beépítette, úgy mint az arckifejezések vagy az ajkak mozgása.
Ezt a szoftvert is tanítani kell saját kiejtésünkre, csakúgy mint a szimpla beszédfelismerő rendszereket, a művelet itt is mintegy egy órát vesz igénybe. Nem csak fordításra, nyelvoktatásra is használható a technológia, az pedig igazán nagy segítség lenne, ha valamiképpen okostelefonokba zsúfolt változatban is sikerülne megjelentetni.