A nyelvészeti szoftverek specialistájának, az idén 15 éves MorphoLogicnak alig egy éve jelent meg első kereskedelmi angol–magyar fordítórendszere, a MetaMorpho. A webszerverekbe épülő online fordító változatot, a MorphoWeb motort rövid ideje már bárki ingyen használhatja. A webforditas.hu címen elérhető szerver egyszerre három hasznos szolgáltatást is kínál: angol–magyar szótárként, beírt (vágólapon keresztül bemásolt) angol szövegeink, illetve az angol nyelvű weblapok magyarra fordítójaként is szolgál.
Lássuk a talán legfontosabb funkciót, a weblapfordítót! Az URL mezőbe beírjuk a lefordításra váró angol oldal címét, rákattintunk a fordít gombra, majd megvárjuk a fordítás megjelenését. A több-kevesebb időt igénybe vevő művelet után megjelenik az eredeti oldal szinte azonos megjelenésű – hasonló tördelés, ugyan ott elhelyezkedő képek stb. –, de már magyarra fordított párja.
A látvány persze nem a lényeg, a legfontosabb kérdés az, hogy mennyire jó a fordítás? Jó és rossz is egyben. Rossz, mert elég érdekes magyarsággal fordulnak le az oldalak, úgy, ahogy egy angolul tanulni kezdő kisdiák próbálkozna először: ragozott kifejezésekkel, de a szavak sorrendje koránt sem felel meg nyelvünk szokásainak. A stilisztikáról már ne is beszéljünk. Ami még borzasztóbb első látásra, hogy nem feltétlen azok a magyar szavak jelennek meg a fordításban, amik a mondat tartalma szerint oda valók, azaz a többértelmű szavakból kisebb-nagyobb galiba támad. Ja, a gép nem érti mit fordít, ahhoz még mindig egy nagy tudású, művelt ember szükséges.
És mi a jó? Az, hogy miután kiszörnyülködtük magunkat az eredmény láttán, mégis csak megértjük a fordítást. Igazából ez az, amit egy angolul nem tudónak a legjobban hiányzik. A felhasználók tudásvágyát az bizonyítja legjobban, hogy a webforditas.hu-t ezidáig a Wikipedia angol oldalainak magyarra fordítására használták legtöbben.
A munka nem áll meg
A fejlesztők is tudják, hogy művük még messze van a befejezéstől – már amennyire a folyamatosan változó nyelvek közt fordító alkalmazások esetében beszélhetünk „végleges” verzióról.
Az eddigi munka viszont két szálon halad tovább: az angol–magyar fordító csiszolgatása mellett elkezdődtek a magyar–angol rendszer munkálatai is. A MetaMorpho gépifordító-rendszer magyar–angol változatának prototípusa várhatólag 2007 első negyedében készül el. A MorphoLogic által kizárólag saját pénzből létrehozott angol–magyar MetaMorpho-projekttel szemben a magyar-angol változatban más intézmények (az MTA Nyelvtudományi Intézete és a Szegedi Tudományegyetem Informatikai Tanszékcsoportja) is részt vesznek egy pályázaton szerzett támogatás (NKFP 2/008/04) jóvoltából.
Az alap, angol–magyar fordítórendszer fejlesztése is jó körülmények közt haladhat tovább, ugyanis a MorphoLogic fontos résztvevője lett az Unió EuroMatrix projektjének. Az EuroMatrix projekt célja egy olyan fordítóprogram létrehozása, mely az EU összes nyelvpárja között fordít. Az uniós finanszírozású projekt új vért visz a gépi fordítás világába azáltal, hogy hibrid − azaz nyelvészeti tudással kibővített statisztikai rendszert hoz létre a fordítási minőség javításának érdekében. A statisztikai gépi fordítás kutatásában ezidáig az Egyesült Államok hadseregének érdekei domináltak, különös tekintettel a kínai valamint az arab nyelvek angolra való fordítására. Az EuroMatrix a gépi fordítás nyelvfüggetlen aspektusaira kíván összpontosítani.
Apróságok magyarul tanulóknak
A MorphoLogic nem csak a fordítórendszerek fejlesztésében serénykedik, 15. születésnapjára kiadott egy csomó olyan terméket is, melyek a magyarul tanulók, illetve a magyart oktatók munkáját segítik:
- DigiMorf: a program a magyar szavak adatbázisa. Tartalmazza a szavak szófaját, leggyakoribb összetételeit, képzett és ragozott alakját, igék esetében az igevonzatokat, ezen kívül többszempontú keresést biztosít.
- Elragoz: ez a teljes magyar ragozási adatbázis, a toldalékolható magyar szavak teljes paradigmáinak közzétételén túl általános morfológiai információkat is nyújt a szavakról, elsősorban a magyar nyelvet tanulók számára.
- Helyesën: a kissé furcsa nevű program segít megtalálni a magyar írásban külön nem jelölt, de a beszélt nyelvben mindig is jelenlevő zárt ë hangokat. Bár e hangunk a nyelvújítást követően jelöletlenné vált a helyesírásban, számos tájnyelv beszélői ma is megkülönböztetik a nyílt, köznyelvi e hangtól.
További termékek és kutatások
Az imént bemutatott termékek és kutatási projektek csak a jéghegy csúcsát jelentik, a MorphoLogic most megújult honlapján egy csomó új és megújult termékkel – pl. az Akadémiai MoBiMouse Plus – találkozhatunk, karácsony előtti akciós áron. De nem csak a kereskedelmi termékekről, hanem a fejlesztők világszerte ismert és elismert, más cégekkel és kutatóintézetekkel közösen végzett nyelvészeti projektjeibe is bepillanthatunk itt.